Oracle está planeando implementar una enorme supercomputadora en la nube con un número récord de GPU conectadas.
El supercluster OCI admitirá hasta 131.072 GPU Nvidia Blackwell y se lanzará en la primera mitad de 2025.
Oracle ha dicho que eso le daría al sistema 2,4 zettaflops de rendimiento máximo, aunque probablemente se refiere al rendimiento de la IA, que se mide en FP8, o cálculos de precisión de 8 bits, en lugar de FP64.
La versión con máximas especificaciones del Supercluster OCI tiene más de tres veces más GPU que la supercomputadora Frontier, el sistema más potente del mundo, y más de seis veces más que otros hyperscalers.
No está claro si las 131.072 GPU estarán disponibles en el lanzamiento; DCD se ha comunicado con Oracle para pedir más información.
“Contamos con una de las ofertas de infraestructura de IA más amplias y brindamos soporte a clientes que ejecutan algunas de las cargas de trabajo de IA más exigentes en la nube”, afirmó Mahesh Thiagarajan, vicepresidente ejecutivo de Oracle Cloud Infrastructure.
“Con la nube distribuida de Oracle, los clientes tienen la flexibilidad de implementar servicios de nube e IA donde lo deseen, preservando al mismo tiempo los más altos niveles de soberanía de datos e IA”.
Existen superclusters OCI más pequeños con GPU Nvidia H100, y otros vienen con GPU H200 y Blackwell. Los superclusters H100 pueden escalar hasta 16 384 GPU con hasta 65 exaflops de rendimiento y 13 Pbps de rendimiento de red agregado.
Los supercúmulos H200, que saldrán a la venta a finales de este año, podrán escalar a 65.536 GPU con hasta 260 exaflops de rendimiento y 52 Pbps de rendimiento de red agregado.
Los supercúmulos OCI con instancias de hardware refrigerado por líquido GB200 NVL72 de Nvidia utilizarán NVLink y NVLink Switch para permitir que hasta 72 GPU Blackwell se comuniquen entre sí con un ancho de banda agregado de 129,6 TBps en un solo dominio NVLink.
No se ha compartido la ubicación del supercluster.
Esta semana, el fundador de Oracle, Larry Ellison, dijo que la compañía tiene actualmente 162 centros de datos en la nube en operación o en construcción a nivel mundial, el más grande de los cuales tiene una capacidad de 800 MW.
Está previsto construir una instalación de un gigavatio que será alimentada por tres pequeños reactores nucleares modulares .