El potencial de ahorro de costes de la compañía al pasar de refrigeración de aire a líquido podría ser enorme cuando opera en tantos centros de datos en todo el mundo como lo hace Microsoft Azure.

Los requisitos de energía de las CPU son hoy en día, por regla general, de más de 200 W, y solo se espera que aumenten. Los aceleradores como GPU, para aprendizaje automático y otros tipos de aplicaciones, ya están en el rango de 250W a 400W.

Google ha estado modernizando muchos de sus centros de datos para que sean compatibles con la refrigeración líquida directa al chip para sus aceleradores de inteligencia artificial personalizados, en algún momento del año pasado; Alibaba está utilizando refrigeración por inmersión total en uno de sus centros de datos; Los nuevos aceleradores de Facebook son tan densos en potencia que sus tuberías de calor y el disipador de calor requerido para enfriar uno tienen un tamaño más cercano a un bloque de cemento que a una placa de circuito.

Microsoft ha compartido algunos resultados de la experimentación con las tecnologías de refrigeración líquida que ha estado haciendo para sus servidores OCP del Proyecto Olympus. El equipo de Azure también solicitó una mayor estandarización de la refrigeración líquida en toda la industria, lo que sugiere que la naturaleza patentada de muchas soluciones existentes está frenando la adopción de nuevos sistemas de refrigeración que serán tan urgentemente necesarios en los próximos dos o tres años.

“En algún momento llegaremos al punto en que algunos de estos chips o soluciones de GPU nos impulsarán a necesitar refrigeración líquida", dijo Brandon Rubenstein, ingeniero principal de la plataforma y gerente del equipo térmico que trabaja en el desarrollo de servidores de Microsoft.

Refrigeración por aire versus refrigeración líquida

El chasis Olympus ya es extremadamente eficiente: la combinación de ventiladores, tubos de calor y disipadores de calor remotos significa que un rack Olympus de 40kW aún puede ser enfriado por aire. Pero la refrigeración líquida tiene más ventajas al permitir mayores densidades de rack y reducir los costos operativos y de ajuste de las instalaciones.

Evitar el flujo de calor, mantiene los componentes a una temperatura más constante y resuelve mejor las fallas; Si un ventilador falla o pierde energía, la CPU debe apagarse en cuestión de segundos para evitar el sobrecalentamiento, mientras que la inercia térmica del líquido puede mantener en funcionamiento un chasis refrigerado por inmersión durante hasta media hora. La humedad, el polvo y la vibración también se convierten en un problema con el líquido. El enfriamiento líquido hace que reutilizar el calor del servidor sea más fácil. Además reduce el uso de agua, un factor que puede limitar el lugar donde se pueden ubicar los centros de datos a hipescala.

Microsoft no está listo para sumergirse

Microsoft no está listo para elegir una tecnología de refrigeración líquida y ejecutarla todavía. La compañía no ha comenzado a implementar ninguna de estas opciones en sus centros de datos de Azure, pero la refrigeración podría convertirse en un problema importante en dos o tres años. Rubenstein predijo que la refrigeración líquida a nivel de rack se estandarizará y se comercializará lo suficiente como para adoptarla en uno o dos años, pero sugirió que las soluciones más avanzadas de centros de datos completos podrían demorar entre cinco y diez años en madurar. Eso debería ser "tiempo suficiente para descubrir cuál es la solución más efectiva y cómo los centros de datos pueden adaptarse", dijo.