Las empresas tecnológicas que invirtieron en el mercado de IA han visto caer los precios de sus acciones después de las afirmaciones de la startup china DeepSeek relacionadas con el costo y el rendimiento de un nuevo modelo de IA.
El modelo R1 LLM (modelo grande de lenguaje ) lanzado por la empresa la semana pasada parece ser comparable a los desarrollados por OpenAI y Meta. Sin embargo, DeepSeek afirma haber entrenado el modelo utilizando chips mucho menos avanzados y por una fracción del costo, aproximadamente 5,5 millones de dólares.
En comparación, en julio de 2024 se informó que los costos de capacitación e inferencia de OpenAI podrían alcanzar los $7 mil millones para el año, y la semana pasada la compañía anunció 'The Stargate Project ', una empresa conjunta con MGX, Oracle y SoftBank que invertirá $500 mil millones en infraestructura de IA durante los próximos cuatro años.
También la semana pasada, el CEO de Meta, Mark Zuckerberg, anunció que la compañía está planeando un gasto de capital de 60 a 65 mil millones de dólares, principalmente en centros de datos y servidores, mientras busca impulsar sus capacidades de inteligencia artificial.
Durante el fin de semana, DeepSeek superó a ChatGPT y se convirtió en la aplicación más descargada en la App Store de Apple en Estados Unidos, mientras que las acciones de Nvidia, Microsoft y Meta cayeron, aparentemente como consecuencia de las afirmaciones de la compañía.
Nvidia cayó un 9% en las operaciones previas a la apertura del mercado, mientras que Meta y Microsoft, que también ha apostado fuerte por la IA en los últimos años, vieron caer sus acciones un 4%. El fabricante holandés de equipos de semiconductores ASML también se vio afectado por la caída, con una caída del 9,7%, mientras que Schneider Electric también vio caer sus acciones un 8,7%.
Las sanciones estadounidenses a los semiconductores de IA avanzada han impedido, en general, que las empresas chinas tengan acceso al mismo hardware que utilizan OpenAI y Meta para entrenar sus modelos. En consecuencia, DeepSeek ha informado que utilizó una reserva de chips Nvidia A100 antiguos además de una cantidad no especificada de H800, un chip de IA reducido diseñado específicamente por Nvidia para el mercado chino para evitar infringir los controles de exportación del gobierno estadounidense.
Aunque el mercado se ha asustado por la tecnología de DeepSeek, cabe señalar que las afirmaciones de la compañía respecto a los costes de hardware y capacitación no han sido verificadas.
Se ha informado que muchas empresas chinas están encontrando formas de adquirir chips Nvidia de última generación, comprándolos a través de mercados secundarios como Singapur.