Amazon Web Services será la primera empresa de nube en ofrecer los Superchips Grace Hopper GH200 de Nvidia en su servicio.
La compañía ofrecerá CPU y GPU combinadas a través de instancias de Amazon Elastic Compute Cloud (Amazon EC2) conectadas a la red EFA de Amazon. Será compatible con la virtualización de AWS Nitro System y los servicios de hiperescala de Amazon EC2 UltraClusters.
AWS también ofrecerá los chips GH200 NVL32 a través de Nvidia DGX Cloud, el servicio propio de Nvidia que ejecuta sobre otros proveedores de nube.
Los hyperscalers esencialmente alquilan los servidores de Nvidia, implementándolos como una nube dentro de su nube que Nvidia puede comercializar y vender a empresas que buscan grandes supercomputadoras con GPU.
Google, Microsoft y Oracle anunciaron previamente que admitirían DGX Cloud, pero, según se informa, AWS se abstuvo. Los demás hyperscalers no han promocionado el servicio DGX Cloud en sus propios sitios web.
"Lo que hace especial este anuncio de DGX Cloud es que será la primera DGX Cloud impulsada por Grace Hopper de Nvidia", dijo Ian Buck, vicepresidente de hiperescala y HPC de Nvidia.
"Es una nueva arquitectura de GPU a escala de rack para la era de la IA generativa".
El GH200 con la arquitectura de rack NVL32 proporciona la memoria compartida más grande en una sola instancia en un servicio en la nube, dijo Nvidia, y admite grandes modelos de lenguaje que pueden alcanzar más de 1 billón de parámetros.