Arm siempre ha tenido una relación problemática con el espacio del servidor.

Los licenciatarios de sus diseños de chips han hecho promesas audaces sobre sus productos y lo que podrían aportar al centro de datos empresarial, a la nube o al campo de la computación de alto rendimiento. Pero, aunque ha habido un éxito limitado, la mayoría de los esfuerzos han fracasado.

Esta vez, sin embargo, la empresa argumenta que es diferente. Las estrellas finalmente se han alineado, con productos competitivos disponibles en los centros de datos, la nube y los mercados de supercomputación.

Con muchos comprensiblemente cautelosos, Arm y HPE intentaron probar la viabilidad de la arquitectura del chip en uno de esos espacios: el campo HPC. Las compañías se asociaron con Suse y las universidades del Reino Unido de Edimburgo, Bristol y Leicester para probar los sistemas HPC de Arm en busca de cargas de trabajo científicas y evaluar si vale la pena invertir en ellas.

Un año después de un proyecto de tres años, el equipo de Catalyst UK cree que los resultados son prometedores.

"El objetivo del programa Catalyst es expandir el ecosistema de software de Arm para garantizar que el software y las aplicaciones informáticas de alto rendimiento que actualmente se ejecutan en x86 se ejecuten en el entorno de Arm", dijo a DCD, Ben Bennett, director de HPC Strategy para EMEA en HPE.

"Estamos tratando de exprimir 25 años de conocimiento de cluster en un programa de tres años".

Los miembros de Catalyst UK se mostraron positivos sobre el progreso que estaban logrando, pero notaron que aún había mucho por aprender durante los siguientes dos años.

Cada una de las tres universidades recibió un sistema que consta de 64 nodos HPE Apollo 70, cada uno con dos procesadores Marvell ThunderX2 de 32 núcleos. Utilizan el servidor Suse Enterprise Linux para HPC y Suse Enterprise Storage, así como las herramientas de software de Arm Allinea Studio.

Arm_Logos.width-358.jpg

"El ThunderX2 de Marvell es uno de los primeros procesadores Arm que tiene el ancho de banda de la memoria y el punto flotante para convertirlo en un competidor serio para las cargas de trabajo de computación de alto rendimiento", dijo Bennett.

"Espero que muchos de nosotros veamos con anhelo a Calxeda y algunas de las primeras variaciones de 32 bits", agregó, refiriéndose a una compañía de procesadores Arm que finalmente fracasó, "pero Marvell se demoró en construir y desplegar algo que nos permita En realidad hacer algo de este trabajo ".

Otros fracasos notables incluyen la línea Centriq de Qualcomm, un producto prometedor que fue injustamente asesinado cuando la compañía se vio obligada a reducir rápidamente los costos mientras luchaba contra un intento de adquisición hostil por parte de Broadcom.

El proyecto de AMD en Seattle también dio pocos frutos, mientras que el Vulkan de Broadcom no tuvo éxito (aunque la tecnología se vendió y finalmente terminó en ThunderX2). Otro jugador potencial, la CPU del servidor Kunpeng 920 de Huawei, podría estar en problemas, con el apoyo de Arm de la compañía.

La marea parece estar cambiando, sin embargo, con el ThunderX2 vendido en supercomputadoras construidas por HPE, Cray y Atos, incluida la supercomputadora Arm más grande del mundo, Astra. "La máquina Astra se estaba desarrollando y construyendo al mismo tiempo que las máquinas Catalyst, son los mismos nodos y algunos de los aprendizajes de construcción que se han introducido en Catalyst", dijo Bennett.

El futuro también verá el lanzamiento de la CPU A64FX Arm de Fujitsu, configurada para alimentar a la supercomputadora de escalas magnéticas Post-K de Japón, también conocida como Fugaku.

Con todo esto en mente, ¿cómo se han mantenido las implementaciones de Catalyst? "Recibimos nuestro sistema a fines de noviembre, y en tres días estuvimos realizando un curso con 20 personas, básicamente funcionó. Y quizás ese no sea el mensaje más emocionante, pero ciertamente es muy interesante", dijo la Dra. Michèle Weiland, gerente de proyecto en el EPCC de Edimburgo, a DCD.

“Hemos podido poner códigos en el sistema, ejecutarlos sin ningún problema en absoluto. Estábamos preparados para cualquier cosa, pero no tuvimos ningún problema".

Los equipos están probando varias cargas de trabajo científico y probando el rendimiento. "Actualmente estamos transfiriendo el código que ya existe, pero con el tiempo desarrollaremos el código [para la arquitectura de Arm]", dijo el Dr. Mark Wilkinson, director de las instalaciones de DiRAC HPC en la Universidad de Leicester.

“Y así podemos aprender, inicialmente, cuál de nuestros códigos existentes se beneficia más y por qué. Y luego podemos retroalimentar eso al diseño de algoritmos de próxima generación que realmente pueden aprovechar más las características arquitectónicas específicas del chip".

Simon Burbidge, director de computación avanzada y HPC en la Universidad de Bristol, agregó que: "Si puede exprimir más el rendimiento en esos sistemas que lo que puede en los demás, por lo tanto, puede obtener más resultados científicos. Esa es nuestra fuerza motriz. Así que tener una nueva plataforma para hacer eso es realmente emocionante".

Con la planeación del Reino Unido para comprar numerosos supercomputadores en los próximos años, Wilkinson dijo, "es clave que sepamos qué tipo de algoritmos pueden aprovecharse de Arm para que podamos decidir cuándo procuramos qué áreas de investigación se benefician más con Arm y para que podamos asegurarnos de que estamos implementando el tipo correcto de arquitectura".