Oracle Cloud Infrastructure (OCI) ahora ofrece GPU AMD Instinct MI300X con software ROCm.
Los aceleradores impulsarán el nuevo superclúster de cómputo OCI de Oracle, llamado BM.GPU.MI300X.8, que podrá admitir hasta 16.384 GPU en un solo clúster.
Las GPU AMD MI300X podrán utilizar la misma tecnología de red ultrarrápida que utilizan otros aceleradores en OCI y están diseñadas para cargas de trabajo de inteligencia artificial (IA), incluida la inferencia y el entrenamiento de modelos de lenguaje grande (LLM).
Las GPU AMD Instinct MI300X están construidas sobre la arquitectura AMD CDNA 3 y están diseñadas para IA, incluida IA generativa, y cargas de trabajo informáticas de alto rendimiento.
Las GPU cuentan con 19.456 procesadores de flujo y 1.216 núcleos de matriz. Los aceleradores tienen un rendimiento máximo de precisión de ocho bits (FP8) con escasez estructurada (E5M2, E4M3) de 5,22 petaflops y un rendimiento máximo de precisión doble (FP64) de 81,7 teraflops.
“AMD Instinct MI300X y el software abierto ROCm siguen ganando impulso como soluciones confiables para impulsar las cargas de trabajo de IA OCI más críticas”, afirmó Andrew Dieckmann, vicepresidente ejecutivo y gerente general de la unidad de negocios de GPU para centros de datos de AMD.
“A medida que estas soluciones se expandan aún más hacia mercados con uso intensivo de IA en crecimiento, la combinación beneficiará a los clientes de OCI con alto rendimiento, eficiencia y mayor flexibilidad en el diseño de sistemas”.
“Las capacidades de inferencia de los aceleradores AMD Instinct MI300X se suman a la amplia selección de instancias de hardware de alto rendimiento de OCI para eliminar la sobrecarga de computación virtualizada que se usa comúnmente para la infraestructura de IA”, agregó Donald Lu, vicepresidente sénior de desarrollo de software de OCI. “Estamos entusiasmados de ofrecer más opciones para los clientes que buscan acelerar las cargas de trabajo de IA a un precio competitivo”.
Esta semana, Vultr también agregó las GPU Instinct MI300X de AMD a su nube de inteligencia artificial (IA).
Nscale también ofrece aceleradores a través de su nube de GPU basada en aceleradores MI00X, así como en las GPU AMD MI250 y las GPU A100, H100 y V100 de Nvidia.
En agosto de 2024, AMD lanzó ROCm 6.2 , la última versión de su pila de software de código abierto. Lanzada por primera vez en 2016, ROCm consta de controladores, herramientas de desarrollo, compiladores, bibliotecas y API para respaldar la programación de aplicaciones de HPC e IA generativa en GPU AMD. La última versión ofrece compatibilidad extendida con modelos de lenguaje grande virtuales (vLLM), entrenamiento e inferencia de IA mejorados en aceleradores AMD Instinct y compatibilidad más amplia con FP8.
A principios de este mes, Oracle anunció que su inversión en el fabricante de chips Ampere Computing podría darle la opción de adquirir la empresa en el futuro. Ampere estima actualmente que el 95 por ciento de los servicios de Oracle utilizan chips Ampere.