28.1.25

The China Academy: Impactos geopolíticos de DeepSeek... A menudo se ha citado a Lenin (posiblemente erróneamente) diciendo: «Hay décadas en las que no pasa nada; y hay semanas en las que pasan décadas». Independientemente de la exactitud de la atribución, esta semana pasará claramente a la historia en la segunda categoría... Lo que hace que los modelos de DeepSeek sobresalgan por encima de los de sus competidores es que son capaces de lograr un rendimiento comparable o superior en todas las categorías evaluadas gastando una fracción del tiempo y el dinero que necesita el siguiente mejor competidor... Y lo que es mejor, gran parte de las características y funcionalidades de DeepSeek son de código abierto bajo una «licencia MIT», lo que significa que cualquiera puede copiar, modificar y distribuir el software y la documentación asociados de forma gratuita y sin restricciones... además, los entusiastas del bricolaje ya han demostrado que el software básico de código abierto DeepSeek puede funcionar en ordenadores de gama baja... Se trata de un hito revolucionario, que tiene unas cuantas implicaciones estratégicas evidentes: Las sanciones estadounidenses a China en materia de semiconductores han fracasado rotundamente... Las valoraciones de los gigantes tecnológicos estadounidenses deben revisarse exponencialmente a la baja... El sur global ya puede disfrutar de los frutos de la IA generativa, todo el mundo tiene acceso a un LLM de código abierto de alto rendimiento con requisitos de hardware relativamente mínimos, la barrera de entrada financiera y de hardware que mantenía al sur global fuera del juego de la IA ha sido prácticamente eliminada, ningún país del mundo puede mantener la tecnología avanzada de IA fuera del alcance de cualquier otro país, grande o pequeño, debido a diferencias geopolíticas... China se encuentra en la posición ideal para vender chips de IA e infraestructura de backend de gama relativamente baja -o los servicios basados en la nube de los mismos- a países en desarrollo que antes no podían permitirse desplegar o utilizar infraestructura informática de alto rendimiento... El hecho de que sea mayoritariamente de código abierto hace que sea casi imposible para cualquier gobierno restringir o prohibir el uso y la proliferación de estas mejoras antes mencionadas, por lo que es mucho más resistente a la agitación geopolítica... A medida que el modelo de código abierto de DeepSeek prolifere, empoderará a miles de millones de personas en todo el mundo, acelerará la innovación global y desafiará el orden tecnológico y económico existente. En esta nueva era, los ganadores serán aquellos que puedan aprovechar el poder de la IA para mitigar los mayores retos de la humanidad, independientemente de su punto de partida geográfico o económico

 "  A menudo se ha citado a Lenin (posiblemente erróneamente) diciendo: «Hay décadas en las que no pasa nada; y hay semanas en las que pasan décadas». Independientemente de la exactitud de la atribución, esta semana pasará claramente a la historia en la segunda categoría. A principios de esta semana, DeepSeek Artificial Intelligence Co., Ltd.-filial del fondo de cobertura chino «High-Flyer Quant»-lanzó la última versión de su Large Language Model (LLM)-DeepSeek R1.

Desde que ChatGPT se popularizó entre los consumidores, importantes gigantes tecnológicos de todo el mundo han estado trabajando en su propia versión de LLM, ya sea Llama de Meta, Grok de X, Claude de Anthropic o 01.AI de Beijing Zero One. Lo que hace que los modelos de DeepSeek sobresalgan por encima de los de sus competidores es que son capaces de lograr un rendimiento comparable o superior en todas las categorías evaluadas gastando una fracción del tiempo y el dinero que necesita el siguiente mejor competidor.

  Como referencia, se dice que DeepSeek gastó unos 6 millones de dólares en entrenar su modelo, utilizando unos 2,8 millones de horas de GPU en más de 2.000 GPU Nvidia H800 (que funcionan aproximadamente a una sexta parte de la velocidad de la serie H100 más avanzada de Nvidia). Logró esta hazaña en menos de 2 meses. Esto supone menos del 10% del coste del siguiente modelo más barato, el Llama 3 (al menos 70 millones de dólares), y menos del 6% de las horas-GPU empleadas por el siguiente competidor no chino más rápido, el GPT-4 de OpenAI (aproximadamente 50-60 millones de horas-GPU empleadas), a pesar de que este último tiene acceso a GPU Nvidia de última generación que superan con creces a las inferiores H800 de DeepSeek. Y lo que es mejor, gran parte de las características y funcionalidades de DeepSeek son de código abierto bajo una «licencia MIT», lo que significa que cualquiera puede copiar, modificar y distribuir el software y la documentación asociados de forma gratuita y sin restricciones.

Se trata de un hito revolucionario en el todavía incipiente sector de los LLM, y este acontecimiento tiene unas cuantas implicaciones estratégicas evidentes:

     1. Las sanciones estadounidenses a China en materia de semiconductores han fracasado rotundamente. Desde los primeros controles de exportación del régimen de Trump contra ZTE a finales de 2017 (y posteriormente contra Huawei a mediados de 2018), Estados Unidos ha impuesto prohibiciones cada vez más estrictas a las exportaciones de semiconductores a China. Estas sanciones no solo prohíben las ventas de productos finales de semiconductores avanzados a China, sino también las ventas de equipos de fabricación de semiconductores, con el fin de evitar que China pueda acceder a los últimos semiconductores y construirlos, y por lo tanto mantener a China por detrás de Estados Unidos en términos de acceso a los últimos avances en IA. Estos 8 años de sanciones cada vez más estrictas no sólo obligaron a las empresas chinas a aumentar su autosuficiencia en toda la cadena de valor de los semiconductores (lo que sería una primicia para cualquier país en la cadena de valor de los semiconductores), sino a utilizar su limitada potencia de cálculo de manera mucho más eficiente en relación con sus homólogos estadounidenses, con el fin de obtener resultados superiores, como lo demuestra el último logro de DeepSeek. Aunque el modelo original de DeepSeek se entrenó con procesadores Nvidia H800 de fabricación estadounidense, es plausible que los modelos posteriores puedan utilizar equivalentes de producción nacional, como el «Ascend 910C» de Huawei. 

Aunque la serie Ascend no tiene acceso a los procesos de fabricación más avanzados (TSMC 2nm), es una plataforma suficientemente buena para ejecutar el modelo DeepSeek R1 a escala. De hecho, los entusiastas del bricolaje ya han demostrado que el software básico de código abierto DeepSeek puede funcionar en ordenadores de gama baja como el Raspberry Pi (aunque sin el modelo completo de 671.000 millones de parámetros), con un consumo de energía tan bajo como el de un smartphone normal.

    2. Las valoraciones de los gigantes tecnológicos estadounidenses deben revisarse exponencialmente a la baja. Hasta el año pasado, se asumía que cualquier empresa que quisiera construir un LLM necesitaba cientos de millones de dólares en hardware sofisticado (que sólo unas pocas empresas como Nvidia pueden proporcionar), y decenas de millones de horas GPU. Esto significa que sólo las empresas tecnológicas más ricas del mundo -Google, Meta, Microsoft, etc.- pueden permitirse construir, mantener y ofrecer los servicios de un LLM. En consecuencia, los beneficios asociados a los servicios LLM se concentrarían en manos de unas pocas empresas que alcanzarían valoraciones de varios billones de dólares (por ejemplo, Nvidia). El lanzamiento de DeepSeek R1 echó por tierra este supuesto.

 Ha demostrado que una startup con menos de 10 millones de dólares puede construir y entrenar un modelo, utilizando hardware antiguo que está muy por detrás de la vanguardia. Por lo tanto, las pequeñas empresas pueden ofrecer servicios rentables a centavos de dólar, dada la baja barrera financiera de entrada. En consecuencia, todos los beneficios (y, por tanto, las valoraciones globales de las empresas) previstos por el oligopolio tecnológico estadounidense deben ahora revisarse a la baja de forma significativa, con consecuencias potencialmente peligrosas para los mercados financieros estadounidenses.

    3. El sur global ya puede disfrutar de los frutos de la IA generativa. El impacto más transformador de DeepSeek no está directamente relacionado con China o EE.UU., sino con el resto del mundo (en particular, el sur global). Ahora que todo el mundo tiene acceso a un LLM de código abierto de alto rendimiento con requisitos de hardware relativamente mínimos, la barrera de entrada financiera y de hardware que mantenía al sur global fuera del juego de la IA ha sido prácticamente eliminada. Además, ningún país del mundo puede mantener la tecnología avanzada de IA fuera del alcance de cualquier otro país, grande o pequeño, debido a diferencias geopolíticas. Los nuevos obstáculos a la aplicación de la IA son ahora la educación y la imaginación.

 Dicho esto, incluso la educación es cada vez menos una barrera para la IA, ya que los usuarios de DeepSeek ya han demostrado la capacidad de desarrollar código de software (incluido código de IA) sin escribir manualmente una sola línea de código. El LLM gratuito y de código abierto de DeepSeek dará rienda suelta a la capacidad imaginativa e innovadora de más de 6.000 millones de personas en el Sur global.

El logro de DeepSeek es sin duda un gran impulso para China en la carrera tecnológica chino-estadounidense. Sus beneficios van mucho más allá de simplemente mitigar el impacto de las prohibiciones estadounidenses a la exportación de semiconductores, su mayor valor añadido potencial procede de otras 2 fuentes:

    1. 1. Ampliación de las oportunidades de exportación de semiconductores. DeepSeek hizo posible ejecutar un LLM escalable y de alto rendimiento en plataformas de hardware relativamente asequibles pero de rendimiento limitado. En consecuencia, el mercado disponible para infraestructuras de IA a pequeña escala para empresas y gobiernos con casos de uso específicos se amplía enormemente en los mercados globales del sur. Como principal fabricante mundial de semiconductores heredados, China se encuentra en la posición ideal para vender chips de IA e infraestructura de backend de gama relativamente baja -o los servicios basados en la nube de los mismos- a países en desarrollo que antes no podían permitirse desplegar o utilizar infraestructura informática de alto rendimiento para casos de uso de IA.

    2. Mayor participación en el ecosistema de desarrolladores de IA. A medida que DeepSeek se convierte en el LLM preferido por desarrolladores de aplicaciones, investigadores y entusiastas de países desarrollados y en vías de desarrollo, su rápida adopción dará lugar a mejoras más rápidas, servicios más disponibles, innovación acelerada y un mayor apoyo de la comunidad para hacer de DeepSeek una alternativa aún más atractiva para un mayor número de personas en el futuro. El hecho de que sea mayoritariamente de código abierto hace que sea casi imposible para cualquier gobierno restringir o prohibir el uso y la proliferación de estas mejoras antes mencionadas, por lo que es mucho más resistente a la agitación geopolítica.

A pesar de las numerosas ventajas para China, también existen importantes riesgos incontrolables que podrían desencadenarse como resultado de este logro. El primero y más importante en la mente de este autor es la posibilidad de que DeepSeek induzca a Estados Unidos a relajar los controles a la exportación de semiconductores, al comprobar la relativa ineficacia de tales medidas. Tal medida podría tener el efecto perjudicial de atraer a las empresas chinas de nuevo a un estado de dependencia de la tecnología estadounidense de mayor rendimiento, desplazando así los ingresos y los dólares de I+D de los advenedizos chinos locales en la cadena de valor de las TIC. Contrariamente a la creencia popular, la sostenibilidad del progreso tecnológico de China es mucho más vulnerable a un EE.UU. más «amistoso» que a uno más «hostil». Otro posible efecto secundario, tal vez inevitable, es que el logro de DeepSeek se sume a una letanía de otros «momentos Sputnik» recientes -ya sea la «Gran Migración Americana de Notas Rojas», el vuelo de prueba de dos plataformas de combate de sexta generación o el reciente avance de la reacción de fusión nuclear sostenida de EAST a más de 1.000 segundos- que podrían galvanizar al público y a las élites estadounidenses por igual para realizar un esfuerzo más coordinado de toda la sociedad para mantener una ventaja tecnológica sobre la RPC. Por desgracia para China, no existen medios prácticos para mitigar ninguno de estos riesgos.

En resumen, el lanzamiento de DeepSeek R1 marca un momento crucial en la evolución de la IA y sus ramificaciones geopolíticas. Al lograr un rendimiento puntero a una fracción del coste y el tiempo que necesitan sus competidores, DeepSeek no sólo ha demostrado la creciente destreza tecnológica de China, sino que también ha reconfigurado el panorama mundial de la IA. El fracaso de las sanciones estadounidenses a los semiconductores para reprimir la innovación china, la posible devaluación de los gigantes tecnológicos estadounidenses y la democratización de la IA para el sur global son sólo el principio de los cambios transformadores que ha propiciado este avance. A medida que el modelo de código abierto de DeepSeek prolifere, empoderará a miles de millones de personas en todo el mundo, acelerará la innovación global y desafiará el orden tecnológico y económico existente. En esta nueva era, los ganadores serán aquellos que puedan aprovechar el poder de la IA para mitigar los mayores retos de la humanidad, independientemente de su punto de partida geográfico o económico."                  

( The China Academy , MRonline, 28/01/25, traducción DEEPL, enlaces en el original)

No hay comentarios: