IBM ha lanzado instancias con GPU Nvidia H100 en su plataforma en la nube.
Los clientes ahora podrán usar las GPU para cargas de trabajo de inteligencia artificial (IA), incluido el entrenamiento y la inferencia.
La incorporación de las H100 se produce tras la implementación por parte de IBM de las GPU Nvidia A100 el año pasado. Según Nvidia, las nuevas GPU permiten un rendimiento de inferencia hasta 30 veces más rápido que las A100.
Además de las A100 y H100, IBM Cloud también ofrece GPU Nvidia L40S y L4 que se pueden utilizar para cargas de trabajo de IA más pequeñas, como el entrenamiento de modelos a pequeña escala o la implementación de chatbots.
Las instancias H100 están disponibles en las regiones multizona de IBM en América del Norte, América Latina, Europa, Japón y Australia. IBM planea ofrecer los procesadores de inteligencia artificial Gaudi 3 de Intel a través de IBM Cloud a principios de 2025.
El lanzamiento de las GPU H100 en IBM Cloud coloca a la plataforma muy por detrás de sus competidores, que han tenido las GPU disponibles durante más de un año en algunos casos.
Amazon Web Services (AWS) comenzó a ofrecer las GPU en julio de 2023, mientras que Google, Microsoft y Oracle lanzaron las H100 en septiembre de ese año.
De manera similar, las empresas emergentes de nube con GPU han tenido acceso desde hace mucho tiempo, y CoreWeave y Cirrascale están entre las que obtuvieron prioridad.
Oracle, Amazon, Microsoft y Google anunciaron que lanzarían la próxima línea de GPU Blackwell de Nvidia en marzo de 2024, y CoreWeave anunció lo mismo unos meses después. La línea Blackwell enfrentó algunos problemas de diseño a principios de este año, pero se resolvieron a fines de agosto de 2024. Nvidia espera enviar las últimas GPU por valor de "varios miles de millones de dólares" en el cuarto trimestre de 2024.
El mes pasado, The Register informó que IBM Cloud estaba atravesando un silencioso programa de "despidos masivos", citando una fuente que dijo que se hizo en secreto y que los empleados debían firmar acuerdos de confidencialidad y no hablar sobre los detalles.
IBM le dijo a The Register en un comunicado: "A principios de este año, IBM reveló un cargo por reequilibrio de la fuerza laboral que representaría un porcentaje muy bajo de un solo dígito de la fuerza laboral global de IBM, y todavía esperamos salir de 2024 aproximadamente con el mismo nivel de empleo con el que entramos".
Teniendo en cuenta los aproximadamente 288.000 empleados que IBM tiene en todo el mundo, un uno por ciento (el porcentaje mínimo de un dígito) representaría 2.880 despidos.
El año pasado, el CEO de IBM, Arvind Krishna, dijo que la compañía esperaba reemplazar alrededor de 7.800 puestos de trabajo con IA.