Microsoft ha comprado el doble de GPU Nvidia Hopper que otras empresas tecnológicas.
Según un informe del FT, los analistas de la consultora tecnológica Omdia estiman que Microsoft ha comprado 485.000 chips Hopper este año.
En comparación, Meta compró aproximadamente 224.000 chips Hopper, mientras que ByteDance y Tencent pidieron aproximadamente 230.000 GPU cada uno, y xAI/Tesla compró aproximadamente 200.000.
De las grandes empresas tecnológicas analizadas por Omdia, Amazon y Google quedaron al final de la tabla, habiendo comprado 196.000 y 169.000 chips Hopper, respectivamente.
Apple no fue incluido en el informe de Omdia, pero recientemente se informó que la compañía está trabajando con Broadcom para desarrollar sus primeros chips de servidor específicos para IA con el fin de reducir su dependencia de las GPU de terceros.
Amazon, Google, Microsoft y Meta también han desarrollado sus propios chips de IA.
Lanzada en marzo de 2022 para reemplazar la arquitectura Ampere de Nvidia, la GPU Hopper tiene 80 mil millones de transistores, fue la primera GPU en admitir PCIe Gen5 y la primera en utilizar HBM3.
Proporciona hasta 30 teraflops de rendimiento pico IEEE FP64 estándar, 60 teraflops de rendimiento pico de núcleo tensor FP64 y 60 teraflops de rendimiento pico FP32.
A pesar del sucesor de Hopper de Nvidia, Blackwell, previsto para principios de 2025, la demanda de las GPU Hopper sigue siendo fuerte.
En declaraciones a DCD en Supercomputing 2024, Dion Harris, director de marketing de productos de centros de datos de Nvidia, dijo que, si bien ha habido mucho revuelo en torno a Blackwell, Hopper seguirá teniendo un "valor increíble" entre los clientes de Nvidia.
"Cuando Grace Blackwell salga al mercado el año que viene, creo que muchas de esas [aplicaciones Hopper] se trasladarán de inmediato y habrá mucho más entusiasmo en términos de rendimiento y beneficios. Pero creo que Grace Hopper está teniendo un impacto transformador en términos de cómo se desarrollan y ejecutan algunas de estas aplicaciones", afirmó.
Los continuos retrasos de Blackwell
Blackwell también tuvo un comienzo desafortunado, ya que sufrió un error de producción inesperado que obligó a Nvidia a anunciar que retrasaría las entregas. Desde entonces, han surgido informes de que los procesadores de IA se sobrecalentaban cuando se conectaban entre sí en bastidores de centros de datos de 72 chips: la configuración GB200 NVL72 es capaz de ejecutar 72 GPU GB200, 36 CPU Grace y nueve bandejas de conmutación NVLink, cada una de las cuales tiene dos conmutadores NVLink.
Y los problemas no terminan ahí. Según un nuevo informe de TrendForce, las especificaciones de diseño más exigentes del bastidor GB200 de Nvidia implican que la cadena de suministro requiere tiempo adicional para su optimización y ajuste.
A pesar de que Nvidia inicialmente planeó comenzar a enviar GPU Blackwell en la segunda mitad de 2024, TrendForce informó que ha habido "únicamente envíos limitados" durante el cuarto trimestre de 2024.
TrendForce señaló además que debido a que los requisitos para las interfaces de interconexión de alta velocidad del GB200 y la potencia de diseño térmico (TDP) exceden significativamente las normas del mercado, la producción en masa, "el período pico de envío para el sistema de rack completo GB200 se pospondrá entre el segundo y el tercer trimestre de 2025".