Google Cloud ahora ofrece máquinas virtuales con Nvidia H100 en tipos de máquinas más pequeñas.
La compañía reveló el 25 de enero que sus máquinas virtuales A3 High con GPU H100 estarían disponibles en configuraciones con uno, dos, cuatro u ocho H100.
Este mes también se han lanzado máquinas virtuales con tecnología Nvidia Blackwell en Google.
Esta medida permitirá a los clientes seleccionar sus necesidades de procesamiento con mayor granularidad, en caso de que la carga de trabajo de entrenamiento sea menor y no necesite las ocho GPU completas.
Esto evitará que los clientes paguen por GPU que no se utilizarán lo suficiente.
Las máquinas A3 están disponibles a través de Vertex AI totalmente administrado, como nodos a través de Google Kubernetes Engine (GKE) y como máquinas virtuales a través de Google Compute Engine.
Eran Dvey Aharon, vicepresidente de investigación y desarrollo de Tabnine, comentó lo siguiente sobre las máquinas virtuales más pequeñas: "Usamos Google Kubernetes Engine para ejecutar el backend de nuestro producto de desarrollo de software asistido por IA. Los tipos de máquinas A3 más pequeñas nos han permitido reducir la latencia de nuestros modelos de asistencia de código en tiempo real en un 36 por ciento en comparación con los tipos de máquinas A2, lo que mejora significativamente la experiencia del usuario".
En una publicación de LinkedIn, el gerente de productos del grupo Google, Nathan Beach, señaló que "otros proveedores de la nube como Amazon Web Services, Oracle y CoreWeave solo proporcionan máquinas virtuales con exactamente 8 GPU H100 por máquina virtual", y agregó: "Google Cloud es el único proveedor importante de la nube que le permite elegir si desea 1, 2, 4 u 8 GPU Nvidia H100 por máquina virtual".
Además de las máquinas virtuales A3 más pequeñas, Google también ha anunciado que sus máquinas virtuales A4 impulsadas por las GPU HGX B200 de Nvidia ya están disponibles en versión preliminar.
La VM A4 está compuesta por GPU Blackwell interconectadas mediante NVLin de Nvidia de quinta generación. Según una publicación del blog de Google, la VM ofrece un "importante aumento de rendimiento en comparación con la VM A3 High de la generación anterior".
Cada GPU B200 ofrece 2,25 veces la capacidad máxima de procesamiento y 2,25 veces la capacidad HBM de la oferta H100.
El Hypercompute Cluster de Google permite a los clientes implementar y administrar grandes clústeres de máquinas virtuales A4 con computación, almacenamiento y redes como una sola unidad.
“Nvidia y Google Cloud tienen una asociación de larga data para llevar nuestra infraestructura de inteligencia artificial acelerada por GPU más avanzada a los clientes”, afirmó Ian Buck, vicepresidente y gerente general de Hiperescala y HPC de Nvidia.
"La arquitectura Blackwell representa un gran paso adelante para la industria de la IA, por lo que estamos entusiasmados de que la GPU B200 ahora esté disponible con la nueva máquina virtual A4. Esperamos ver cómo los clientes aprovechan la nueva oferta de Google Cloud para acelerar su misión de IA".