"La mayoría de los lectores ya conocerán la noticia. DeepSeek, una
empresa china de IA, lanzó un modelo de IA llamado R1 que es comparable
en capacidad a los mejores modelos de empresas como OpenAI, Anthropic y
Meta, pero fue entrenado a un costo radicalmente menor y utilizando
menos que los chips GPU de última generación. DeepSeek también ha hecho
públicos suficientes detalles del modelo como para que otros puedan
ejecutarlo en sus propios ordenadores sin coste alguno.
DeepSeek es un torpedo que ha alcanzado a las Siete Magníficas empresas estadounidenses de alta tecnología por debajo de la línea de flotación. DeepSeek no utilizó los últimos y mejores chips y software de Nvidia; no requirió un gasto enorme para entrenar su modelo de IA, a diferencia de sus rivales estadounidenses; y ofrece otras tantas aplicaciones útiles.
DeepSeek construyó su R1 con los chips más antiguos y lentos de Nvidia, que las sanciones estadounidenses habían permitido exportar a China. El gobierno estadounidense y los titanes tecnológicos pensaban que tenían el monopolio del desarrollo de la IA debido a los enormes costes que suponía fabricar mejores chips y modelos de IA. Pero ahora el R1 de DeepSeek sugiere que las empresas con menos dinero pronto podrán explotar modelos de IA competitivos. R1 puede utilizarse con un presupuesto muy reducido y mucha menos potencia de cálculo. Además, R1 es tan bueno como sus rivales en «inferencia», la jerga de la IA para cuando los usuarios cuestionan el modelo y obtienen respuestas. Y funciona en servidores para todo tipo de empresas, de modo que no necesitan «alquilarlo» a precios enormes a empresas como OpenAI.
Y lo que es más importante, el R1 de DeepSeek es de «código abierto», es decir, sus métodos de codificación y entrenamiento están abiertos a todo el mundo para que los copie y desarrolle. Esto supone un duro golpe para los secretos «patentados» que OpenAI o Gemini de Google encierran en una «caja negra» para maximizar sus beneficios. La analogía aquí es con los productos farmacéuticos de marca y los genéricos.
El gran problema para las empresas estadounidenses de IA y sus inversores es que parece que la construcción de enormes centros de datos para albergar múltiples y costosos chips puede no ser necesaria para lograr resultados suficientemente satisfactorios. Hasta ahora, las empresas estadounidenses han estado acelerando enormes planes de gasto y tratando de recaudar ingentes cantidades de financiación para hacerlo. De hecho, el mismo lunes en que el R1 de DeepSeek saltaba a las noticias, Meta anunciaba otra inversión de 65.000 millones de dólares, y solo unos días antes el presidente Trump anunciaba subvenciones gubernamentales de 500.000 millones de dólares a los gigantes tecnológicos como parte del llamado proyecto Stargate. Irónicamente, el director ejecutivo de Meta, Mark Zuckerberg, dijo que invertía porque «Queremos que Estados Unidos establezca el estándar mundial de IA, no China.» Oh cielos.
Ahora a los inversores les preocupa que este gasto sea innecesario y, lo que es más importante, que afecte a la rentabilidad de las empresas estadounidenses si DeepSeek puede ofrecer aplicaciones de IA a una décima parte del coste. Cinco de los mayores valores tecnológicos orientados a la IA -el fabricante de chips Nvidia y los llamados «hiperescaladores» Alphabet, Amazon, Microsoft y Meta Platforms- perdieron en conjunto casi 750.000 millones de dólares de su valor bursátil en un solo día. Y DeepSeek amenaza los beneficios de las empresas de centros de datos y los operadores de agua y electricidad que esperan beneficiarse de la enorme «escalada» de los Siete Magníficos. El boom bursátil estadounidense está muy concentrado en los «Siete Magníficos».
¿Ha pinchado DeepSeek la enorme burbuja bursátil de los valores tecnológicos estadounidenses? El inversor multimillonario Ray Dalio cree que sí. Dijo al Financial Times que «los precios han llegado a niveles que son altos al mismo tiempo que hay un riesgo de tipos de interés, y esa combinación podría pinchar la burbuja…Donde estamos en el ciclo ahora mismo es muy similar a donde estábamos entre 1998 o 1999,» dijo Dalio.«En otras palabras, hay una nueva tecnología importante que sin duda cambiará el mundo y tendrá éxito. Pero algunos confunden eso con que las inversiones tengan éxito».
Pero puede que no sea así, al menos de momento. Puede que las acciones de la empresa de chips de inteligencia artificial Nvidia se hayan desplomado esta semana, pero su lenguaje de codificación «propietario», Cuda, sigue siendo el estándar de la industria estadounidense. Aunque sus acciones cayeron casi un 17%, eso solo las devuelve al nivel (muy, muy alto) de septiembre.
Lo que debe enfurecer a los oligarcas de la tecnología que adulan a Trump es que las sanciones de EE.UU. a las empresas chinas y las prohibiciones a las exportaciones de chips no han impedido que China siga avanzando en la guerra de la tecnología y los chips con EE.UU. China está logrando dar saltos tecnológicos en IA a pesar de los controles a la exportación introducidos por la administración Biden con la intención de privarla tanto de los chips más potentes como de las herramientas avanzadas necesarias para fabricarlos.
Huawei, el campeón tecnológico chino, se ha convertido en el principal competidor de Nvidia en China en chips de «inferencia». Y ha estado trabajando con empresas de IA, incluida DeepSeek, para adaptar modelos entrenados en GPU de Nvidia para ejecutar inferencia en sus chips Ascend. «Huawei está mejorando. Tienen un hueco, ya que el Gobierno está diciendo a las grandes empresas tecnológicas que tienen que comprar sus chips y utilizarlos para inferir», afirmó un inversor en semiconductores en Pekín.
Esta es una demostración más de que la inversión planificada en tecnología y competencias tecnológicas dirigida por el Estado chino funciona mucho mejor que depender de enormes gigantes tecnológicos privados dirigidos por magnates. Como dijo Ray Dallo: «En nuestro sistema, en general, nos estamos moviendo hacia un tipo de política más industrial-compleja en la que va a haber actividad ordenada por el gobierno e influenciada por el gobierno, porque es tan importante… El capitalismo por sí solo -el motivo del beneficio por sí solo- no puede ganar esta batalla.»
No obstante, los titanes de la IA aún no son el titanic. Siguen adelante con su «escalada» invirtiendo más y más miles de millones en centros de datos y chips más avanzados. Esto aumenta exponencialmente la potencia de los ordenadores.
Y, por supuesto, no se tiene en cuenta lo que a los economistas convencionales les gusta llamar educadamente «externalidades». Según un informe de Goldman Sachs, una consulta ChatGPT necesita casi 10 veces más electricidad que una búsqueda en Google. El investigador Jesse Dodge hizo algunos cálculos aproximados sobre la cantidad de energía que consumen los chatbots de IA. «Una consulta a ChatGPT consume aproximadamente tanta electricidad como la que podría encender una bombilla durante unos 20 minutos,«, afirma. «Así que, puedes imaginarte con millones de personas usando algo así cada día, eso suma una cantidad realmente grande de electricidad». Más consumo de electricidad significa más producción de energía y, en particular, más emisiones de gases de efecto invernadero de origen fósil.
Google tiene el objetivo de alcanzar las emisiones netas cero para 2030. Desde 2007, la empresa ha afirmado que sus operaciones eran neutras en carbono gracias a las compensaciones de carbono que compra para igualar sus emisiones. Pero, a partir de 2023, Google escribió en su informe de sostenibilidad que ya no iba a «mantener la neutralidad operativa de carbono». La empresa afirma que sigue presionando para alcanzar su objetivo de cero emisiones netas en 2030. «La verdadera motivación de Google aquí es construir los mejores sistemas de IA que puedan», afirma Dodge.«Y están dispuestos a dedicar muchos recursos a ello, por ejemplo entrenando sistemas de IA en centros de datos cada vez más grandes hasta llegar a superordenadores, lo que supone un enorme consumo de electricidad y, por tanto, emisiones de CO2».
Luego está el agua. Mientras Estados Unidos se enfrenta a sequías e incendios forestales, las empresas de IA están succionando aguas profundas para «enfriar» sus megacentros de datos y proteger así el chip.
Más que eso, las empresas de Silicon Valley están tomando cada vez más
el control de la infraestructura de suministro de agua para satisfacer
sus necesidades. Las investigaciones sugieren, por ejemplo, que podrían
haberse utilizado unos 700.000 litros de agua para refrigerar las
máquinas que entrenaron a ChatGPT-3 en las instalaciones de datos de
Microsoft.
Entrenar modelos de IA consume 6.000 veces más energía que una ciudad
europea. Además, aunque minerales como el litio y el cobalto se asocian
más comúnmente a las baterías del sector del motor, también son
cruciales para las baterías utilizadas en los centros de datos. El
proceso de extracción suele implicar un uso importante de agua y puede
provocar contaminación, lo que socava la seguridad hídrica.
Sam Altman, el anterior héroe sin ánimo de lucro de Open AI, pero que ahora busca maximizar los beneficios de Microsoft, argumenta que sí, que por desgracia hay «compensaciones» a corto plazo, pero que son necesarias para alcanzar la llamada AGI; y que la AGI nos ayudará a resolver todos estos problemas, por lo que la compensación de las «externalidades» merece la pena.
¿AGI? ¿Qué es? La inteligencia artificial generalizada (IAG) es el santo grial de los desarrolladores de IA. Significa que los modelos de IA llegarían a ser «superinteligentes», muy por encima de la inteligencia humana. Cuando eso se consiga, promete Altman, su IA no sólo podrá hacer el trabajo de un solo trabajador, sino el de todos ellos: «La IA puede hacer el trabajo de una organización». Este sería el colmo de la maximización de la rentabilidad mediante la supresión de los trabajadores en las empresas (¿incluso en las empresas de IA?), ya que las máquinas de IA se encargan de operarlo, desarrollarlo y comercializarlo todo. Este es el sueño apocalíptico del capital (pero una pesadilla para los trabajadores: sin trabajo, sin ingresos).
Por eso Altman y los demás magnates de la IA no dejarán de ampliar sus centros de datos y desarrollar chips aún más avanzados sólo porque DeepSeek haya rebajado sus modelos actuales. La empresa de investigación Rosenblatt pronosticó la respuesta de los gigantes tecnológicos: «En general, esperamos que el sesgo esté en la mejora de la capacidad, esprintando más rápido hacia la inteligencia general artificial, más que en la reducción del gasto» Nada debe detener el objetivo de la IA superinteligente.
Algunos ven la carrera hacia la consecución de la AGI como una amenaza para la propia humanidad. Stuart Russell, profesor de informática de la Universidad de California en Berkeley, afirmó que «Incluso los directores ejecutivos que participan en la carrera han declarado que quienquiera que gane tiene una probabilidad significativa de causar la extinción humana en el proceso, porque no tenemos ni idea de cómo controlar sistemas más inteligentes que nosotros mismos»,dijo. «En otras palabras, la carrera AGI es una carrera hacia el borde de un precipicio».
Puede ser, pero sigo dudando de que la «inteligencia» humana pueda ser sustituida por la inteligencia de las máquinas, principalmente porque son diferentes. Las máquinas no pueden pensar en cambios potenciales y cualitativos. El nuevo conocimiento procede de tales transformaciones (humanas), no de la ampliación del conocimiento existente (máquinas). Sólo la inteligencia humana es social y puede ver el potencial de cambio, en particular el cambio social, que conduce a una vida mejor para la humanidad y la naturaleza.
Lo que la aparición de DeepSeek ha demostrado es que la IA puede desarrollarse hasta un nivel que puede ayudar a la humanidad y a sus necesidades sociales. Es gratuita y abierta y está a disposición del menor usuario y desarrollador. No se ha desarrollado con ánimo de lucro ni para obtener beneficios. Como dijo un comentarista: «Quiero que la IA me lave la ropa y los platos para poder dedicarme al arte y la escritura, no que la IA me lave la ropa y los platos para poder dedicarme al arte y la escritura». Los directivos están introduciendo la IA para «facilitar los problemas de gestión a costa de las cosas para las que mucha gente no cree que deba utilizarse la IA, como el trabajo creativo…..». Para que la IA funcione, tiene que venir de abajo arriba, o será inútil para la inmensa mayoría de las personas en el lugar de trabajo».
En lugar de desarrollar la IA para obtener beneficios, reducir los puestos de trabajo y el sustento de los humanos, la IA bajo propiedad y planificación común podría reducir las horas de trabajo humano para todos y liberar a los humanos del trabajo para que se concentren en el trabajo creativo que sólo la inteligencia humana puede realizar. Recordemos que el «santo grial» fue una ficción victoriana y más tarde también de Dan Brown."
No hay comentarios:
Publicar un comentario