IBM ha anunciado dos nuevos chips centrados en IA para sus mainframes Z-systems.
En el evento Hot Chips 2024 de esta semana en California, IBM ha revelado detalles de la arquitectura del próximo procesador Telum II y los chips aceleradores Spyre.
“Las nuevas tecnologías están diseñadas para escalar significativamente la capacidad de procesamiento en los sistemas mainframe IBM Z de próxima generación, lo que ayuda a acelerar el uso de modelos de IA tradicionales y modelos de IA de lenguaje grande en conjunto a través de un nuevo método de conjunto de IA”, afirmó la compañía.
Diseñado para impulsar los sistemas IBM Z, el nuevo chip Telum II presenta mayor frecuencia, capacidad de memoria, un crecimiento del 40 por ciento en caché y un núcleo acelerador de IA integrado, así como una unidad de procesamiento de datos (DPU) conectada coherentemente en comparación con el chip Telum de primera generación.
Cada Telum II cuenta con ocho núcleos que funcionan a 5,5 GHz, con 36 MB de caché L2 por núcleo, lo que suma un total de 360 MB. La caché virtual de nivel 4 de 2,88 GB por cajón de procesador proporciona un aumento del 40 por ciento con respecto a la generación anterior.
Cada Spyre cuenta con hasta 1 TB de memoria, diseñada para funcionar en conjunto con las ocho tarjetas de un cajón de E/S normal y para consumir no más de 75 W por tarjeta. Cada chip tendrá 32 núcleos de cómputo que admiten tipos de datos int4, int8, fp8 y fp16.
Se espera que el nuevo procesador sea compatible con las soluciones informáticas empresariales para los LLM, satisfaciendo las complejas necesidades de transacciones de la industria. La DPU está diseñada para acelerar los protocolos de E/S complejos para redes y almacenamiento en el mainframe. Cada chip acelerador Spyre se conecta a través de un adaptador PCIe de 75 vatios y se basa en tecnología desarrollada en colaboración con IBM Research.
Ambos chips serán fabricados por Samsung Foundry, socio de fabricación de IBM desde hace muchos años, en el nodo de proceso de 5 nm de la primera. Tanto Telum como Spyre estarán disponibles el año que viene.
"Nuestra sólida hoja de ruta multigeneracional nos posiciona para permanecer a la vanguardia de las tendencias tecnológicas, incluidas las crecientes demandas de IA", afirmó Tina Tarquinio, vicepresidenta de gestión de productos de IBM Z y LinuxONE. "El procesador Telum II y el acelerador Spyre están diseñados para ofrecer soluciones informáticas empresariales de alto rendimiento, seguras y con mayor eficiencia energética. Después de años de desarrollo, estas innovaciones se introducirán en nuestra plataforma IBM Z de próxima generación para que los clientes puedan aprovechar los LLM y la IA generativa a escala".
IBM ha dicho que un sistema equipado con un clúster Spyre podría aprovechar modelos de inteligencia artificial mucho más complejos para identificar patrones de fraude intrincados que un modelo menos sofisticado podría haber pasado por alto.
La compañía anunció el chip Telum original en 2021. Lanzó su último mainframe y el primero con el chip Telum equipado, el z16, en 2022.