En la edición de la International Supercomputing Conference (ISC) que se celebrará este mes de junio en Fráncfort, la computación exascale dará mucho de qué hablar. La expectación mediática en torno a los sistemas exascale ha ido aumentando en los últimos meses y hay buenas razones para ello. Desde que superamos la barrera del petaFLOPS en 2008, los tecnólogos, compañías e instituciones de investigación han puesto sus miras en el próximo gran hito de la informática. Ahora empezamos a ver este hito como algo que está a nuestro alcance y compañías y consorcios anuncian sus planes para crear los primeros sistemas exascale. Todos cuantos trabajamos en el mundo de los superordenadores sabemos que buena parte de esta expectación nace simplemente de la fascinación por descubrir cuál será el siguiente sistema más potente; cuándo llegará el siguiente gran logro y quién gozará del reconocimiento que apareja el alcanzar nuevas cotas de potencia y tamaño. En el ámbito de la supercomputación nunca estamos satisfechos y siempre tenemos la vista puesta en el futuro. Ya estamos viendo cómo se presentan diseños para futuros sistemas muy prometedores. Y tal y como cabía esperar, las tecnológicas, agencias y proveedores de siempre compiten por pasar a hacer historia. Dada la escala, ambición e importancia de semejante logro, resulta comprensible. Con todo ello, llegamos a una conclusión ineludible: el pistoletazo de salida de la carrera por crear el primer sistema exascale ya ha sonado.
¿Es el pasado un mero prólogo del futuro?
Repasemos algunos de los logros y avances tecnológicos que fueron necesarios para que pudiéramos crear los primeros sistemas petascale. Cuando se publique la nueva versión de la lista Top500 este mes de junio con motivo de la ISC, se habrán cumplido oficialmente 11 años desde que IBM puso en funcionamiento el sistema Roadrunner en Los Alamos National Labs, superando así oficialmente la barrera del petaFLOPS por primera vez. También conviene recordar que Roadrunner rompió oficialmente la barrera del petaFLOPS casi 11 años después de que el ASCI Red de Sandia National Laboratories se erigiera en el primer sistema en superar la barrera del teraFLOPS. Hicieron falta 11 años para multiplicar por 1.000 el rendimiento del sistema más potente del mundo. ¿Y en qué punto nos encontramos hoy, pasados 11 años desde el récord de Roadrunner? Hoy, los sistemas más potentes ofrecen un rendimiento de algo más de 200 petaFLOPS, lo que representaría una quinta parte del incremento en el rendimiento que vimos en el periodo entre ASCI Red y Roadrunner.
La desaceleración en el progreso hacia los sistemas exascale respecto al periodo que nos llevó de terascale a petascale ha sido documentado ampliamente. Los principales factores son la ralentización y muerte de la Ley de Moore, los desafíos técnicos y los costes necesarios para llegar a los procesos de litografía en 7 nm y los retos físicos de construir un sistema exascale. Estos últimos ya resultan desalentadores por sí solos: limitaciones de espacio y en el suministro eléctrico, necesidades en materia de refrigeración, la escalabilidad de las redes, la compleja gestión de los sistemas y los edificios e instalaciones necesarios, etc. Los retos tecnológicos que se deben superar para ofrecer tecnologías revolucionarias y aumentar el rendimiento respecto a anteriores generaciones de hardware han elevado la presión entre las tecnológicas y las instalaciones especializadas para HPC. Y a pesar de todo ello, deberíamos estar más cerca de llegar a los sistemas exascale de lo que realmente estamos. Así pues, como industria, tenemos que recuperar terreno.
Curiosamente, la presión para ir alcanzando nuevas cotas de rendimiento constantemente está llevando al sector de la supercomputación a volver la vista al pasado. Permitidme que me explique. Hasta la llegada de Roadrunner, los sistemas que obtuvieron los récords de rendimiento anteriores solían estar construidos en torno a tecnologías propietarias. Las grandes tecnológicas creaban sistemas inmensos para un puñado de clientes. Así pues, los superordenadores eran el dominio exclusivo de una parte muy pequeña del total del mercado informático, por lo que los mercados ajenos a la supercomputación debían conformarse con utilizar sistemas convencionales para realizar sus investigaciones, a menudo a ritmos terriblemente lentos. Los avances en computación se producían en la cúspide del sector, mientras el resto los veía con la esperanza de que en algún momento llegarían a las masas. Roadrunner acabó con aquel paradigma.
Como sus predecesores, Roadrunner fue diseñado para un único cliente del máximo nivel. Además, Roadrunner fue el fruto de alianzas entre los pesos pesados de la informática, que unieron fuerzas para diseñar un sistema capaz de alcanzar un petaFLOPS. Sin embargo, Roadrunner contribuyó a democratizar la HPC porque partió de un planteamiento muy diferente. La base tecnológica para Roadrunner fue el uso de tecnologías disponibles ya disponibles para los consumidores, en lugar de depender de formatos, tecnologías y componentes propietarios de diseño específico. IBM optó por sus BladeCenter con procesadores AMD Opteron como base de la infraestructura de procesamiento. Para el sistema operativo se optó por Linux y se creó la herramienta Extreme Cluster Administration Tool (xCAT) 2.0, (también de código libre), específicamente para poder gestionar la gran escala del sistema. Esto vino a ser una declaración categórica de que las tecnologías de estándares libres habían llegado para quedarse.
Así, Roadrunner revolucionó todas las convenciones sobre cómo diseñar un superordenador. A partir de los primeros años de la década del año 2000, los superordenadores basados en componentes de consumo y bajo coste y de software de código libre empezaron a multiplicarse, a medida que nuevos sectores necesitaban contar con las ventajas en competitividad que brinda la investigación mediante HPC. Los sistemas operativos Linux, unidos a las tecnologías de los procesadores x86, ofrecían al mundo estándares de computación libres y accesibles, eliminando la necesidad de contar con presupuestos de más de 100 millones de dólares para poder competir. Los avances tecnológicos que se habían producido en el mundo de la informática personal habían llegado al fin al mundo de los centros de datos. La consecuencia más importante de todo ello fue que múltiples proveedores podían ofrecer las mismas tecnologías, lo que contribuyó a recrudecer la competencia. Al mismo tiempo, asistimos al surgimiento explosivo de la era de Internet, en la que los sistemas x86 de doble zócalo se convirtieron en la norma para proveedores de Internet y de hosting, en instalaciones que recibirían el nombre de "hyperscalers", por sus dimensiones y su capacidad de ofrecer precios realmente sostenibles. Crear sistemas enormes a partir de servidores convencionales ha demostrado ser una forma muy rentable de contar con servicios informáticos. Así, los enormes sistemas de diseño específico comenzaron a dejar paso a clústeres generalistas escalables bajo Linux, utilizando herramientas y tecnologías al alcance de todos.
Probablemente a nadie sorprenda que los gobiernos nacionales en general, y el estadounidense en particular, se cuenten entre los principales impulsores de los proyectos para crear sistemas exascale. Lo que resulta interesante en este caso es que, a diferencia de lo que vimos con sus predecesores petascale, ahora estamos viendo cierta presión por volver a tecnologías propietarias. Interconectores, racks, sistemas de refrigeración, placas base, canalizaciones y formatos fuera de todo estándar. Formatos completamente fuera de lo común. Disponibles de manos de un único proveedor. Obviamente, ha sido la ralentización en el progreso hacia los sistemas exascale la que ha impulsado esta vuelta al pasado y bien podría suceder que fuera uno de estos sistemas el primero en romper la barrera del exaFLOPS. Sin embargo, un sistema de estas características tendría poco atractivo a nivel comercial, ya que la mayoría de clientes han optado por evitar verse atrapados por un único proveedor y siguen confiando en estándares libres para sus proyectos exascale.
Lenovo
En Lenovo, reconocemos que el desarrollo conjunto y las alianzas de colaboración entre los mejores equipos son necesarias a la hora de abordar grandes retos con garantías de éxito, como es el caso de la computación exascale. Creemos que el planteamiento que se adoptó en el desarrollo de Roadrunner, que empleaba componentes de consumo y potenciaba su rendimiento mediante la colaboración y el desarrollo conjunto con el usuario final, es el correcto. El planteamiento de Lenovo para sus proyectos exascale combinará los conocimientos que hemos ido acumulando a lo largo de dos décadas de desarrollo bajo estándares libres, con las experiencias positivas que hemos tenido con instituciones como el centro de supercomputación alemán Leibniz-Rechenzentrum (LRZ) de Múnich. Nuestra alianza de colaboración con el LRZ, por ejemplo, nos impulsa a desarrollar soluciones que aumenten el rendimiento de nuestros productos de consumo. La base tecnológica que hizo posible el superordenador SuperMUC-NG del LRZ, el equipo que se situó 8º de la lista Top500 en noviembre de 2018, es algo que ponemos a disposición de todos nuestros clientes.
Desde Lenovo continuaremos diseñando sistemas conjuntamente con clientes como el LRZ, con el fin de hacer posibles diseños de sistemas de nueva generación que puedan alcanzar el exaFLOPS. La filosofía de Lenovo, que pasa por la adopción en cascada de los avances tecnológicos, es una parte fundamental de nuestra identidad. Valernos de nuestras alianzas de colaboración y nuestros conocimientos para hacer avanzar la informática para, a continuación, poner esos avances en manos de nuestros consumidores es nuestro objetivo último. Por ello, adoptamos diseños que siguen los estándares del sector en todos los aspectos, que van desde la infraestructura y los formatos de los sistemas, hasta el software y las soluciones de administración. Queremos continuar con el legado de Roadrunner, garantizando que los avances en HPC sigan siendo accesibles para todos. En lugar de volver la vista al pasado y desarrollar sistemas propietarios con fines específicos que solo un puñado de clientes puede permitirse, en Lenovo continuaremos trabajando para garantizar que todos los usuarios gozan de las ventajas de las últimas innovaciones tecnológicas en cuanto se estas se producen. Nuestro objetivo es poner sistemas exascale al alcance de todos.