Google ha anunciado una nueva máquina virtual de supercomputación, que podría crecer hasta alcanzar 26.000 GPU Nvidia H100 Hopper.
Con todas las especificaciones, la supercomputadora A3 es capaz conseguir hasta 26 exaflops de rendimiento de IA. El sistema no está ubicado en un solo centro de datos, sino que son los recursos agrupados de múltiples instalaciones.
Una sola máquina virtual A3 cuenta con ocho GPU H100, ancho de banda biseccional de 3,6 TB/s a través de Nvidia NVSwitch y NVLink 4.0, procesadores escalables Intel Xeon de cuarta generación y 2 TB de memoria host a través de DIMM DDR5 de 4800 MHz.
También es la primera instancia en utilizar la Unidad de procesamiento de infraestructura (IPU) Intel personalizada de Google, que según la compañía permite 10 veces el ancho de banda de la red sobre las máquinas virtuales A2.
“Las máquinas virtuales A3 de Google Cloud, con tecnología de GPU Nvidia H100 de próxima generación, acelerarán el entrenamiento y el servicio de aplicaciones de IA generativa”, dijo Ian Buck, vicepresidente de computación de hiperescala y alto rendimiento en Nvidia.
“Inmediatamente después de las instancias G2 lanzadas recientemente por Google Cloud, estamos orgullosos de continuar nuestro trabajo con Google Cloud para ayudar a transformar empresas de todo el mundo con una infraestructura de inteligencia artificial especialmente diseñada”.
Google ha informado que las instancias fueron diseñadas teniendo en cuenta el entrenamiento de IA. "Dadas las demandas de estas cargas de trabajo, un enfoque único para todos no es suficiente: se necesita una infraestructura diseñada específicamente para la IA", dijeron Roy Kim y Chris Kleban de Google Cloud en una publicación de blog.
La empresa también ofrece sus propios chips de TPU en la nube, pero las GPU de Nvidia han acaparado gran parte del mercado de IA generativa.