A medida que aumenta la densidad de los racks y los chips se calientan más, algunos recurren al enfriamiento líquido de depósito abierto basado en inmersión para combatir el calor.

En un escenario de depósito abierto, hay dos tipos distintos de refrigerante: monofásico y bifásico; la fase significa el estado en el que se encuentra el refrigerante en un momento dado durante el ciclo de enfriamiento.

Los refrigerantes monofásicos permanecerán en estado líquido, mientras que los refrigerantes bifásicos cambiarán de estado líquido a gaseoso a medida que se produzca la transferencia de calor. Exploraremos ambos ejemplos a través de dos implementaciones del mundo real.

DUG McCloud
– DUG

Monofásico - DUG McCloud Data Center - Houston TX

El especialista en computación de petróleo y gas DownUnder GeoSolutions (DUG) abrió su supercomputadora 'Bubba' de 15MW en una sala de datos de 2.044 metros cuadrados construida en asociación con Skybox Data Centers en Houston, Texas. Se implementó en 2019.

A 250 petaflops (precisión simple) una vez que se implementa por completo, la computación de alto rendimiento de 15MW de DUG requiere sistemas únicos de energía y rechazo de calor para operar.

Diseñados internamente, los elementos de cómputo de DUG HPC se enfrían por completo mediante una inmersión completa en un fluido dieléctrico, seleccionado específicamente para operar en condiciones de temperatura elevada. Ranurado verticalmente en un depósito abierto, esencialmente un bastidor en su parte posterior, se quitan los disipadores de calor y los chips están en contacto directo con el fluido.

El fluido no es tóxico, no es inflamable, es biodegradable, no es polar, tiene una baja viscosidad y, lo que es más importante, no conduce la electricidad.

Los intercambiadores de calor están sumergidos en el tanque con el equipo de cómputo, lo que significa que nunca sale líquido dieléctrico del tanque y tiene una fuente de alimentación centralizada.

La implementación viene con una serie de beneficios, desde reducir considerablemente el consumo total de energía de la instalación hasta reducir masivamente la complejidad del sistema de enfriamiento. Mark Lommers, ingeniero jefe de DUG y diseñador de esta solución, le dijo a DCD que "por cada 1MW de cómputo en tiempo real que desee usar, termina usando 1,55MW de energía o algo así" para los sistemas tradicionales de refrigeración por agua fría.

En un sistema de refrigeración por inmersión, se eliminan muchos equipos que consumen mucha energía. Un excelente ejemplo de esto son los fanáticos del servidor. Lommers agregó que "no hay bombas de agua enfriada y no hay enfriadores que participen porque no hay agua por debajo de la temperatura ambiente involucrada", y concluyó que "la potencia total real que obtenemos de eso es solo 1.014MW, lo cual es un gran cambio sobre los 1,55MW que teníamos antes”.

El circuito de enfriamiento se simplifica enormemente y, por lo tanto, es más confiable. Más aún porque debe lidiar con menos cambios de temperatura, el sistema general es más robusto ya que se necesitan menos controladores trabajando en conjunto para una operación eficiente.

Como los componentes se encuentran por debajo del nivel del líquido, la empresa afirma que no hay oxidación ni ensuciamiento de los componentes. “Vemos un beneficio muy, muy alto en la reducción de los costos de mantenimiento y también en la reducción de la tasa de fallas del equipo”, dijo Lommers.

Microsoft Wiwynn Immersion Cooling
– Microsoft

Enfriamiento de inmersión bifásico: nube pública de Microsoft

En 2021, Microsoft implementó una solución de enfriamiento por inmersión de dos fases para sus cargas de trabajo en la nube pública, desarrollada en asociación con el fabricante de servidores taiwanés Wiwynn.

En ese momento, la compañía dijo que “los correos electrónicos y otras comunicaciones enviadas entre los empleados de Microsoft están literalmente haciendo hervir el líquido dentro de un tanque de almacenamiento de acero repleto de servidores informáticos en este centro de datos en la orilla este del río Columbia”.

Dentro del tanque de almacenamiento de acero de Microsoft, el calor generado por los chips desnudos hace que el fluido hierva. A medida que los vapores ascienden, se encuentran con un serpentín condensador que se encuentra en la tapa del tanque. Los vapores golpean el serpentín y se condensan, volviendo al estado líquido y volviendo a caer en la tina, creando efectivamente un sistema de enfriamiento de circuito cerrado.

Al igual que con el ejemplo anterior, la infraestructura de enfriamiento se reduce considerablemente ya que no se necesitan controladores de aire ni enfriadores: un enfriador seco (básicamente un radiador grande) hace circular refrigerante tibio en un tanque de inmersión de baño abierto y proporciona enfriamiento sin líquido, sin necesidad de perder o evaporar el fluido para enfriar.

Se utilizan diseños de placa de servidor especiales que son más pequeños en tamaño y se acoplan a ciegas a sus conectores de alimentación en la parte inferior del tanque, como en el otro ejemplo, se insertan y se apilan horizontalmente.

Otro aspecto menos conocido de este enfoque de enfriamiento es su capacidad para concentrar el calor debido al uso de radiadores, lo que a su vez permite escenarios reales de reutilización del calor, como la calefacción urbana, donde a menudo el calor latente enfriado por aire es demasiado bajo para ser de algún uso real.

Además, Microsoft también está reconociendo la oportunidad de overclocking que brinda esta solución. Husam Alissa, director de enfriamiento y rendimiento avanzados de Microsoft, explicó que: "Podríamos ir tan alto y tan bajo con las densidades que queramos, podríamos admitir cientos de kilovatios en un solo tanque a medida que densificamos el hardware".

Microsoft ha compartido los diseños y el aprendizaje detrás de este proyecto con la industria en general a través del Open Compute Project, ya que busca hacer crecer el ecosistema de esta tecnología.

Pero hay una razón por la que Microsoft no ha implementado este sistema en todos sus centros de datos: el ecosistema aún no está del todo allí, el personal no está capacitado para los nuevos enfoques y las preguntas críticas sobre los suministros de soluciones de enfriamiento, la seguridad y la seguridad han surgido. aún por responder.

Más importante aún, aún no está claro qué tan grande será el mercado para los sistemas ultradensos, con muchos racks todavía felices tarareando por debajo de 10kW.

Si esa densidad aumenta, los operadores actualmente tienen una serie de enfoques diferentes para elegir, y dentro de eso, una variedad de factores de forma y caminos que podrían tomar. No existen estándares acordados ni consensos establecidos, ya que la tecnología y su implementación aún se encuentran en las primeras etapas.

Se necesitarán proyectos como estos, y su éxito a largo plazo, para que otros se sientan cómodos para dar el paso.