DeepSeek revela a Silicon Valley como un tigre de papel

Las ballenas son los animales más grandes de todo el planeta, con especímenes que alcanzan hasta 30 metros de longitud y un peso de doscientas toneladas. A pesar de su tamaño colosal, se desplazan en el agua con una gracia y discreción tal que, a menudo, los marinos no advierten su presencia hasta que están demasiado cerca. Por eso resulta providencial que el logo de DeepSeek, la empresa de IA china que está revolucionando el sector tecnológico tenga una ballena como su logo.

En febrero de 2025, esta compañía, lanzó un nuevo modelo de inteligencia artificial generativa que resultó ser comparable a los modelos de empresas como OpenAI, Google, Meta y Anthropic. La principal diferencia radica en que DeepSeek afirma haber desarrollado su modelo a una fracción del coste que han invertido las grandes tecnológicas. La prohibición estadounidense de exportar los mejores chips de IA de NVidia significa que DeepSeek ha logrado lo que muchos creían imposible: construir y entrenar uno de los modelos de IA más impresionantes utilizando los chips disponibles en China que creíamos obsoletos: un verdadero "momento Sputnik".

DeepSeek logró completar el entrenamiento en solo dos meses a un costo de $5.6 millones de dólares, una fracción de las sumas que supuestamente gastaron OpenAI, Google y Meta. A pesar de su extremo bajo coste, las puntuaciones de DeepSeek en los benchmarks de rendimiento de IA demuestran que es tan bueno, si no mejor, que los modelos más recientes de vanguardia de las principales empresas estadounidenses. Es casi tan bueno como el modelo o1 de OpenAI en el "índice de calidad de análisis artificial", una clasificación independiente de análisis de IA, y supera a los modelos de Google, Anthropic y Meta. NVidia vendía sus chips H100 con un margen de beneficio del 1000% debido a la creencia que sólo con estos chips se podría alcanzar la calidad de modelos de las tecnológicas americanas. Según el informe técnico de DeepSeek, su modelo se entrenó utilizando GPUs NVidia H800, similares a las H100, pero diseñadas específicamente para el mercado chino y así cumplir con las restricciones de exportación estadounidenses.

El nuevo modelo fue anunciado en un informe técnico en diciembre, pero fue publicado (con todos los detalles mencionados) el 21 de enero de 2025. Durante el siguiente fin de semana, la gente empezó a prestar mucha atención a su calidad. El siguiente lunes (27 de enero), al abrir la bolsa, el Nasdaq bajó alrededor del 3,5%, con Nvidia cayendo un 17%. Se trató de una caída de 600.000 millones de dólares en la capitalización bursátil, superior a la capitalización bursátil total de ExxonMobil. Parecería que por fin el mercado tiene una prueba sólida de lo que muchos sospechábamos: que el sector de las grandes tecnológicas estadounidenses está inflado sostenido por un gasto desmesurado.

El tiempo no podría haber sido más inconveniente, apenas unos días antes, el recién inaugurado Trump había anunciado con bombos y platillos el proyecto Stargate, incluyendo planes para construir hasta 20 grandes centros de datos de IA en EE. UU., con una inversión inicial de 100 000 millones de dólares y planes de hasta 500 000 millones de dólares para 2029.

Por ello, con la corrección del mercado, no sólo bajaron las acciones de NVidia y empresas que trabajan con IA; también fueron afectadas empresas de centros de datos, empresas de servicios públicos y gestión energética (pensaban reabrir reactores nucleares para surtir las demandas de energía), el cobre, mineras. Los inversores ahora creen que para el desarrollo de estos modelos ya no requieren las enormes concentraciones de infraestructura de centros de datos a las cuales nos tienen acostumbrados los centros administrados por las empresas tecnológicas de gran capitalización.

De esta venta masiva de acciones también podemos interpretar que los mercados occidentales fallaron en la apuesta de dominar el mercado de la IA con un único modelo ganador (como lo hizo Google en el mundo de buscadores web), la aparición de DeepSeek (y su modelo R1) abre la posibilidad a muchos modelos diferentes ejecutándose en centros de datos más pequeños por todo el mundo.

A diferencia del resto de empresas en el campo de la Inteligencia Artificial, DeepSeek no forma parte de una gran empresa tecnológica ni está financiada por capital de riesgo, en cambio, desde el 2023 DeepSeek ha publicado varios modelos con libre acceso, lo cual ha hecho que el código sea de código abierto. Esta licencia impone muy pocas restricciones a la reutilización, permitiendo a los usuarios modificarlo incluso para uso comercial propietario. También permite hacer un peritaje a como desarrollaron y entrenaron el modelo.

Los ingenieros de IA chinos, al enfrentarse a GPU menos eficientes, se centraron en código más eficiente y encontraron formas inteligentes de sortear las limitaciones. Gracias a las eficiencias que encontraron, entrenar el nuevo modelo costó alrededor de 5,6 millones de dólares, aproximadamente una décima parte de lo que le costó a Meta entrenar su modelo Llama. Este episodio pone de manifiesto los límites de las sanciones tecnológicas, que pueden generar disrupciones a corto plazo, pero su impacto disminuye con el tiempo a medida que otros países innovan y se adaptan. El auge de DeepSeek es un recordatorio de que las limitaciones a veces pueden impulsar la innovación.

En comparación, con acceso ilimitado al dinero, Meta ha gastado hasta ahora más en GPUs que el gobierno de EE. UU. en todo el Proyecto Manhattan (ajustado a la inflación). Open AI ha estado gastando más de cinco mil millones de dólares al año y proyecta que para 2029 gastará casi 40 mil millones de dólares al año.

El ascenso de DeepSeek demuestra que era falsa la creencia que la empresa que pudiera gastar más tenía más probabilidades de ganar la carrera de la IA.

Silicon Valley aparece ahora como el emperador desnudo, todas las grandes promesas de los últimos quince años, como los NFT, la Web3, el metaverso y la realidad virtual, han sido completamente rechazadas por el mercado, y ahora que todos apuestan por la IA generativa, quemando dinero sin una vía real para obtener rentabilidad. El baldado de agua fría de DeepSeek parece que predice la llegada de aún más competencia. DeepSeek no es el único modelo chino de IA. Alibaba, Tencent, ByteDance y Moonshot cuentan con modelos que están alcanzando lentamente a sus pares estadounidenses, sobre todo superándolos en rentabilidad. Debido a las restricciones a la exportación impuestas por EE. UU. a los chips de IA avanzados, las empresas chinas de IA se han visto obligadas a innovar con algoritmos, arquitectura y estrategias de entrenamiento más eficientes.

Aún es muy pronto para afirmar que DeepSeek sea el ganador a largo plazo, pero el hecho de que DeepSeek haya podido construir un modelo de razonamiento con los chips más antiguos y lentos de NVidia sugiere que la puerta está abierta a otros competidores, no solo en la creación de modelos de IA, sino también en la fabricación de chips.

Si como se ha dicho la IA es la nueva carrera espacial, no deberíamos dar por descontado que EE.UU. será el ganador.

Fuentes:

 



Esta nota ha sido leída aproximadamente 963 veces.



Rodrigo Bernardo Ortega

Colombiano de los sesentas (1.961), periodista digital independiente, por su formación académica ha adquirido mucha preocupación por el mundo en general, así como por la región de América del Sur y su país en particular. De pensamiento crítico, sus artículos se dirigen a analizar las situaciones políticas, ambientales, deportivas y socioeconómicas. Preocupado por las relaciones de desigualdad en el mundo, busca siempre dar voz a LA OTRA OPINIÓN.\n\nSiempre trata de escribir sus artículos en lenguaje sencillo, dirigidos al gran público, acompañados de imágenes clarificadoras o divertidas, basando la información suministrada en datos confiables que se pueden consultar en fuentes independientes. No suministra mayor información adicional, pues su interés no es publicitar su nombre y ejecutorias, sino SUS IDEAS.

 [email protected]

Visite el perfil de Rodrigo Bernardo Ortega para ver el listado de todos sus artículos en Aporrea.


Noticias Recientes:



OSZAR »