Escondido en un tranquilo pueblo finlandés, dentro del gigantesco salón de una fábrica de papel en desuso, DCD se encuentra con una enorme caja brillante.
Estamos en Kajaani, situada en el centro de Finlandia, para ver Lumi, un proyecto de la Unión Europea de 7,1 MW que ayudará al Bloque mientras entramos en las primeras entradas de una era de investigación científica asistida por inteligencia artificial.
Lumi, la octava supercomputadora más potente del mundo (recientemente salió del top cinco), estaba destinada a lucir bien. «La Reina del Norte», como la llaman sus operadores, es un edificio dentro de otro edificio.
El cavernoso salón del antiguo sitio de United Paper Mills es tan grande que actúa simplemente como una primera capa protectora alrededor del propio centro de datos, construido en proporciones comparativamente modestas, de 300 metros cuadrados.
Una supercomputadora HPE Cray EX235a con sistema operativo Windows, cuenta con 2978 CPU AMD Epyc Trento, 11 912 GPU AMD MI250X y otras 2048 CPU AMD de doble socket en una partición independiente. En total, ofrece un rendimiento sostenido de 379,7 petaflops (HPL).
Su fachada es intencionadamente irregular, con paredes rectas sustituidas por ángulos irregulares. La fachada está surcada por rendijas, de las que emerge una luz brillante. A diferencia del habitual centro de datos gris, este se asemeja más a una bola navideña futurista.
“El revestimiento y el aspecto del aluminio eran una cuestión relativamente trivial dentro del presupuesto, y presionamos al gerente de producto y a los arquitectos para que presentaran algo que pareciera especial”, dice el Dr. Pekka Manninen, director de ciencia y tecnología en Lumi.
“Solo por el trabajo de las partes interesadas y la buena voluntad política, creo que ha valido la pena”.
En una época de crisis económicas y políticas constantes, donde la ciencia suele ser criticada como un lujo derrochador, el Dr. Manninen y el resto del equipo de Lumi se esfuerzan por destacar una y otra vez las virtudes de las supercomputadoras. Lumi ha sido beneficiosa para la población local, para la UE y para la humanidad en general, afirman.
El colapso de la fábrica de UPM, que en su día fue el mayor empleador de la ciudad, no fue la sentencia de muerte económica que podría haber sido para Kajaani. UPM invirtió millones en apoyar a los empleados despedidos y en convertir las instalaciones en un parque empresarial tras el cierre en 2008, mientras que el gobierno finlandés inyectó decenas de millones más.
Casi al mismo tiempo, el aumento del precio de la fibra de madera finlandesa y la disminución de la demanda de papel se cobraron otra víctima: la fábrica Summa de Stora Enso en Hamina, al sur.
Google adquirió ese sitio en 2009 y lo convirtió en un centro de datos único refrigerado por agua de mar. En mayo de 2024, Google anunció una ampliación del sitio por valor de 1.000 millones de euros, lo que elevó su inversión total en Finlandia a más de 4.500 millones de euros.
Ese acuerdo les dio al Dr. Manninen y al Centro de Tecnologías de la Información para la Ciencia (CSC) de Finlandia una idea: buscar su propia fábrica de papel en desuso. El CSC operaba en Keilaniemi, cerca de Helsinki, en ese momento. "Es el precio por metro cuadrado más caro del país, y luego resultó que no podríamos poner en funcionamiento más de 1 MW", dice el Dr. Manninen. "Vimos lo que hizo Google y evaluamos tres fábricas diferentes antes de terminar aquí".
Kajaani se beneficia de temperaturas ambientales bajas, pero no extremadamente bajas, y cuenta con una serie de centrales hidroeléctricas construidas para apoyar la fábrica, con unos 235 MW disponibles.
El CSC pronto trasladó las supercomputadoras nacionales de Finlandia a unas instalaciones en el parque empresarial Renforsin Ranta de la ciudad, y el gobierno volvió a proporcionar financiación adicional para apoyar a Kajaani. SGI, Cray e incluso la rusa T-Platforms proporcionaron supercomputadoras a la agencia a lo largo de los años.
Actualmente alberga las supercomputadoras nacionales de Finlandia, Mahti y Puhti, que serán reemplazadas por Roihu de 49 petaflops.
El parque, más amplio, también alberga un centro de datos de Borealis, más sistemas gubernamentales y, próximamente, un sistema de la empresa británica de comercio de alta frecuencia XTX Markets. En una curiosa anécdota histórica, Google compró este noviembre un terreno en Kajaani (aunque no en la planta) para un posible centro de datos, argumentando la creciente comunidad de centros de datos.
Lumi se inauguró en 2021 como un proyecto conjunto con la UE. «Estuvimos negociando la adquisición durante la COVID-19 y, en junio de 2021, comenzamos la instalación, empezando por los procesadores de alto rendimiento y los sistemas de almacenamiento», recuerda el Dr. Manninen.
Luego comenzamos la segunda fase: la implementación de la GPU. Pero nos vimos afectados por otro evento inesperado: la escasez mundial de productos electrónicos. De repente, fue imposible conseguir algunos componentes pequeños, como controladores de potencia, FPGA, etc. Nos vimos retrasados por chips de un dólar.
Aun así, el equipo puso el sistema completamente en línea, con su partición GPU, en el verano de 2022, justo antes de que ChatGPT se lanzara y cambiara todo.
"Cuando se diseñó Lumi, la era de la IA generativa no era previsible, pero sabíamos que el aprendizaje profundo sería enorme", explica a DCD el Dr. Aleksi Kallio, gerente del programa de desarrollo de IA de CSC .
Un colega suyo trabajaba en el Ministerio de Educación, al que CSC reporta, cuando se estrenó el chatbot. "Tienen reuniones periódicas, y en la anterior, decidieron que ya no nos interesa tanto este tema de la IA, porque quizá esté desapareciendo", dijo. "Y entonces surgió ChatGPT: en la siguiente reunión, decidimos que volvíamos a estar muy interesados en el tema".
La Universidad de Turku ha utilizado Lumi para desarrollar grandes modelos lingüísticos (LLM) específicos para finlandés y lenguas nórdicas. Hasta ahora, estos lenguajes han sido ignorados por los desarrolladores de sistemas de IA con intereses comerciales. Además de su impacto en el mantenimiento de un lenguaje para el posible siguiente paso de la informática, también beneficia a la IA de forma más amplia, afirma Katja Mankinen.
"No hay mucho finlandés disponible en internet", afirma Mankinen, científico de datos sénior de CSC. "Los datos son bastante limitados, pero combinaron recursos finlandeses con recursos más amplios, como el inglés, y desarrollaron algunos trucos muy útiles para crear modelos finlandeses de alto rendimiento sin comprometer su calidad. Así que creemos que esto sentará las bases para el futuro en el desarrollo de aplicaciones de IA".
El Dr. Kallio añade: «Las empresas comerciales no hacen las cosas abiertamente. No revelan qué tipo de datos proporcionan los modelos. No hablan de la arquitectura del modelo. Hay muchos detalles ocultos, pero estos modelos son públicos para que todos los usen y aprendan de ellos, para que otros investigadores los desarrollen a partir de ellos».
Mankinen afirma que este es solo un proyecto en la supercomputadora: «En Lumi, se puede construir de todo, desde las escalas más pequeñas: desde simular la materia de las partículas, cómo interactúan y cuáles son sus propiedades, hasta lo que sucede en el universo a escala galáctica. También tenemos proyectos que contribuyen a problemas sociales, como la cura del cáncer, la creación de medicina personalizada, la ayuda a personas con problemas de salud, etc.».
Lumi funciona como otras supercomputadoras bajo el paraguas de la Empresa Común de Computación de Alto Rendimiento Europea (EuroHPC JU): los estados miembros y los financiadores del proyecto obtienen una parte del sistema, mientras que el país anfitrión que pagó más puede utilizar más.
Finlandia ofrece una parte de su componente a las empresas, pero el acceso solo es gratuito si publican los resultados en código abierto; de lo contrario, deben pagar. Se espera que su trabajo sea, en general, de interés público. Las cargas de trabajo militares están prohibidas.
Otra carga de trabajo es Destination Earth (DE), un ambicioso proyecto de la UE para simular el planeta entero, cubierto exclusivamente por primera vez por DCD en 2020 (ver número 37).
“Este es un proyecto de la Comisión Europea para desarrollar un sistema de información que apoye la toma de decisiones, de modo que puedan elaborar políticas basadas en hechos científicos”, afirma el Dr. Mankinen. “¿Podemos hacer algo respecto al clima global? ¿Cómo podemos adaptarnos? ¿Qué ocurrirá con los alimentos, los incendios forestales, las precipitaciones, etc.? Estas son preguntas sociales”.
A diferencia de cualquier otro proyecto, cuenta con una sección dedicada en el centro de datos para el almacenamiento de datos, con una capacidad aproximada de 100 PB. Actualmente no cuenta con recursos informáticos dedicados, por lo que compite por tiempo con los demás, pero esto podría cambiar en el futuro a medida que el proyecto crezca en alcance.
No hay límite superior para las exigencias de la simulación de la Tierra, señala el Dr. Mankinen, cuando se le pregunta qué tan grande podría ser la supercomputadora Destination Earth.
DE también representa un potencial punto de inflexión en el desarrollo de supercomputadoras.
Históricamente, la computación de alto rendimiento se ha centrado en simulaciones de punto flotante de 64 bits de alta precisión, pero la IA ha impulsado el uso de puntos flotantes cada vez más bajos, llegando potencialmente a FP4. «Los fabricantes de GPU parecen centrarse mucho en los fallos de la IA», afirma el Dr. Mankinen.
“Las cargas de trabajo tradicionales de FP64 no son necesariamente más rápidas en la próxima generación de GPU de lo que son actualmente, tal vez sean incluso más lentas.
“Probablemente veremos una bifurcación en las supercomputadoras, donde algunas se parecerán más a los sistemas de IA y otras a los sistemas de HPC”.
El Dr. Kallio tiene la esperanza de que esto no suceda: «Realmente desconocemos el futuro de la IA y la forma más segura de construirlo es contar con capacidades de propósito general bien conectadas. Creo y espero que no tome caminos diferentes, sino que podamos mantenernos en un solo camino con una sola tecnología».
"Por supuesto, esto podría significar que tendremos algunos aceleradores y hardware de propósito especial conectados a través del clúster de GPU de propósito general".
En cuanto a proyectos como DE, afirma que «lo que consideramos de suma importancia para el futuro es la fusión de los métodos de IA y HPC en la ciencia. Normalmente, se empieza con la simulación mediante HPC y luego se construye un modelo de IA a partir de esos datos».
Todo esto lleva a los trabajadores de Lumi, que planean implementar un sistema de IA más grande en la UE en los próximos años, de nuevo a su argumento central: la supercomputadora ha sido una bendición para la sociedad.
A escala local, el sistema también ofrece beneficios, aunque no en términos de empleos: «Un error común es pensar que es necesario ubicar el centro de datos donde está el personal», afirma el Dr. Kallio. «Nuestro personal no está aquí; está en Helsinki. En Kajaani, somos un equipo mínimo».
Lumi produce agua residual a 40 °C, que CSC eleva a 80 °C con bombas de calor para enviarla a la red de calefacción urbana existente. El sistema de calefacción "quema prácticamente todo lo que puede quemar, incluidos alimentos y petróleo", explica el Dr. Mankinen. "Por eso decimos que Lumi es carbono-negativo, porque puede reducir la cantidad que quema".
Durante el verano, prácticamente toda la calefacción que necesita Kajaani proviene de nosotros, pero en invierno, todavía necesitan quemarse.
CSC también está usando el sistema de alimentación ininterrumpida (UPS) de la supercomputadora para ejecutar un programa piloto de regulación de la frecuencia de la red, pero el Dr. Mankinen admite que sólo desplegaron sistemas UPS para cumplir con los requisitos de adquisición.
Cuando era una fábrica de papel, el sitio experimentó solo un corte de energía de dos minutos durante sus 38 años de operaciones, gracias a la energía hidroeléctrica estable y cercana.
Una futura supercomputadora a escala exa puede eliminar por completo el sistema UPS, postula, mientras presenta una visión para una serie de sistemas cada vez más grandes en Kajaani.
«La supercomputación tiene un gran impacto», afirma el Dr. Mankinen, tanto en potencia como en coste. «Podemos y debemos usar supercomputadoras para mejorar la calidad de nuestro futuro».