A Equinix, gigante do colocation, trouxe como uma oferta de serviços o resfriamento líquido bifásico.
Há um ano, a empresa vem testando os sistemas de resfriamento líquido da ZutaCore em seu centro de co-inovação. Em junho de 2022, a organização instalou parte da tecnologia bifásica em servidores para sua oferta de infraestrutura Metal como serviço. O blog da empresa relata que um rack com refrigeração bifásica operacional, em seu Data Center NY5 em Secaucus, em Nova Jersey, se manteve estável por seis meses.
O resfriamento líquido começa a ser usado para aplicações exigentes, pois remove mais eficientemente o calor dos servidores. E o resfriamento em duas fases melhora ainda mais isso porque o fluido remove mais calor quando ferve.
"Para nosso primeiro ambiente de produção [bifásico], resfriado por líquido, fomos com um conjunto padrão de hardware: sem CPUs com excesso de energia, sem GPUs", afirmou o CTO da Equinix, My Truong.
"Escolhemos converter as plataformas AMD SP3 refrigeradas a ar já no campo (as instâncias de metal que nossos clientes conhecem como m3.large.x86). Estes servidores padrão 19 em 1RU são um sistema de alto volume para nós, uma frota que está prontamente disponível para testes lado a lado", explicou Truong.
Estes processadores podem produzir até 200W de calor, uma potência de projeto térmico (TDP), que é compatível com os sistemas de resfriamento a ar existentes, mas a Equinix prevê servidores TDP mais altos chegando este ano, e queria testar o resfriamento em duas fases em uma quantidade conhecida. A empresa também quer usá-lo em sistemas de produção como servidores que executam o plano de controle e portal do cliente para Equinix Metal, um serviço de nuvem desenvolvido a partir da Packet, que a Equinix adquiriu em 2020.
Os engenheiros da Equinix instalaram um trocador de calor líquido-ar de 6-RU no fundo de um rack, com um manifold distribuindo líquido para mais de 20 sistemas de 1-RU naquele rack. Tubos azuis transportavam o fluido refrigerante para reservatórios ligados diretamente aos chips quentes, onde o fluido evaporou e foi levado por tubos vermelhos para o coletor onde condensou, antes de retornar ao trocador de calor - um processo detalhado exaustivamente em uma galeria de fotos no blog.
"As pequenas passagens laterais do servidor para o coletor são importantes", disse Truong. "Um coletor compartilhado através de racks não é um método de instalação sugerido".
O sistema ZutaCore utiliza o fluido Novec, que se vaporiza a 33°C (92°F), de modo que o reservatório mantém o chip a essa temperatura.
"Treinamos equipes de Data Centers por décadas para que líquidos e eletrônicos não andem juntos", diz Truong, mas o sistema de duas fases minimiza esse problema. "O coletor e suas conexões rápidas utilizam um projeto sem vazamento que libera, no máximo, uma gota de fluido quando desconectado. O fluido em si também evapora completamente em condições atmosféricas".
Os sistemas foram testados sob pressão para detectar quaisquer vazamentos potenciais.
Segundo Truong, o sistema estava removendo menos calor do que o ZutaCore recomenda, mas manteve facilmente as temperaturas do processador abaixo de 52°C em todos os momentos, "o que é consideravelmente menor do que qualquer equivalente a 1U refrigerado a ar sob carga".
O engenheiro prevê que as arquiteturas dos Data Centers mudarão em breve. "O resfriamento líquido do Data Center passará de ser quase exclusivamente no domínio do HPC para se tornar um requisito padrão para os sistemas. Operadores de colocation como a Equinix mudarão os edifícios e as políticas operacionais para permitir aos clientes alavancá-lo na busca da sustentabilidade".
Como um serviço de nuvem executado por um fornecedor de colocation, o serviço Equinix Metal deu à Equinix uma chance de experimentar algo que seus clientes podem precisar adotar no futuro.
Truong chama a atenção para um problema com resfriamento líquido - ele produz benefícios que não são medidos pela métrica de eficiência líder da indústria, PUE. "A métrica de eficiência energética do Data Center, que foi criada em grande parte com a suposição de que a refrigeração do ar e os ventiladores eram uma parte necessária dos servidores, switches e roteadores, não captura realmente os benefícios da refrigeração líquida", diz ele: "A refrigeração líquida direta ao chip remove principalmente a necessidade de ventiladores de servidor, tornando o PUE mais alto enquanto reduz o uso total de energia".
Nvidia e Vertiv propuseram uma nova métrica: Eficiência Total de Uso, ou TUE, e Truong aprova. Truong disse: "Uma métrica mais holística e atualizada deve ser mais parecida com a do TUE do que com a do PUE".
Recentemente, surgiram problemas com resfriamento em duas fases. A 3M anunciou que irá eliminar gradualmente a Novec por causa do aumento da regulamentação pelos riscos à saúde dos produtos químicos PFAS, incluindo a Novec. Essas regulamentações também podem afetar as alternativas propostas por outros fornecedores.