A indústria de data centers tem sido capaz de gerenciar com eficácia as demandas crescentes e garantir um crescimento sustentável. Adotar uma abordagem holística é fundamental para ir além da visão convencional em silos e aprimorar nossa compreensão dos data centers para um roteiro de otimização multiobjetivo.
Este artigo explora as tendências que revolucionam os data centers em 2025, destacando o cenário dinâmico e em evolução do setor de data centers. Uma visão de helicóptero das fontes de energia e do consumo é apresentada antes de mergulhar nas principais tendências.
Energia
A energia sempre foi e continua sendo a pedra angular do nosso progresso. Nos próximos anos, espera-se que a produção de energia continue a crescer, alimentada pelo crescimento econômico e pelo aumento da demanda. Em 2023, o fornecimento global de energia primária atingiu aproximadamente 620EJ ou 172.000 TWh, com uma forte dependência de petróleo, carvão e gás natural, que combinados representaram cerca de 81%, enquanto as energias renováveis representaram cerca de 15% e a energia nuclear 4%.
A eletricidade é uma fonte de energia secundária gerada a partir de fontes de energia primárias. Em 2023, o consumo global de eletricidade atingiu um nível recorde próximo a 108EJ ou 30.000 TWh, altamente dependente de carvão, energias renováveis, gás natural e nuclear. Em 2024 e 2025, espera-se que a demanda por eletricidade cresça a uma taxa mais rápida de 3% a 4% ano a ano, também alimentada pela eletrificação global.
Os data centers contribuíram significativamente para o aumento da demanda de eletricidade em muitas regiões. Em 2022, data centers e criptomoedas consumiram aproximadamente 460TWh globalmente, respondendo por cerca de 2% da demanda mundial de eletricidade. Esse consumo está projetado para exceder 1.000 TWh até 2026. Embora o consumo global de eletricidade do data center tenha aumentado marginalmente, alguns países com mercados de data center em expansão estão experimentando um rápido crescimento.
Prevê-se que cargas de trabalho com uso intensivo de computação disparada, novas abordagens para atender a requisitos de energia mais altos, adoção de refrigeração líquida e esforços em sustentabilidade e eficiência sejam as principais tendências que continuarão a revolucionar os data centers em 2025. É importante reconhecer, no entanto, que não existe uma solução única para enfrentar esses desafios.
As cargas de trabalho com uso intensivo de computação estão disparando, criando um ponto de inflexão
As cargas de trabalho do data center foram profundamente impactadas pela recente explosão de cargas de trabalho com uso intensivo de computação, incluindo HPC, IA e IA generativa. Essas cargas de trabalho estão impulsionando a produção de novos equipamentos de TI, ao mesmo tempo em que transformam o cenário do data center, aumentando o número de data centers de IA prontos ou dedicados à IA.
A diversidade e a evolução das cargas de trabalho com uso intensivo de computação apresentam novos desafios. Para acomodar novos equipamentos de TI com maior potência de design térmico ('superchips' superiores a 1kW) e densidades de potência de rack mais altas (50+kW, 100+kW, 300+kW por rack), os data centers devem adotar soluções de resfriamento e energia mais eficientes.
Como exemplo de cargas de trabalho generativas de IA, o modelo ChatGPT-2 da OpenAI, lançado em 2019, variou de 117 milhões a 1,5 bilhão de parâmetros. O GPT-3, lançado em 2020, continha 175 bilhões de parâmetros, enquanto o GPT-4, introduzido em 2023, tem cerca de 500 bilhões de parâmetros. O número de parâmetros indica as capacidades de aprendizado e geração de texto dos modelos.
Normalmente, quanto maior o modelo, mais sofisticadas são suas habilidades de compreensão e geração, o que significa uma demanda significativamente maior por recursos computacionais para treinar e operar. Precisamos ter em mente que essas são novas cargas de trabalho que nunca foram processadas e os aplicativos estão apenas começando a inundar o mercado.
Os data centers dedicados de IA estão se tornando cada vez mais uma realidade, oferecendo densidades otimizadas de computação, rede e energia para processar novas cargas de trabalho com uso intensivo de computação, atendendo às metas de eficiência, confiabilidade, escalabilidade, segurança e sustentabilidade. A densidade de energia é muito maior em comparação com os data centers tradicionais, mas como as cargas de trabalho e os aplicativos estão aumentando exponencialmente, as instalações também estão crescendo em tamanho. Até 2026, espera-se que os data centers dedicados de IA consumam entre 100 e 300 TWh.
A Nvidia está liderando e dominando o mercado de chips de IA. No entanto, o campo está repleto de oportunidades, à medida que os concorrentes apresentam suas próprias soluções. Eles variam de startups a empresas como Google, Microsoft, Amazon e Meta, a designers de chips como Intel, AMD, Broadcom, Ampere e Cerebras.
Novas abordagens para satisfazer requisitos de energia mais altos estão amadurecendo
A energia consumida em um data center é correlacionada à carga de trabalho processada. Quantificar com precisão o consumo de energia da IA generativa, como uma consulta ChatGPT, é difícil devido a vários fatores, incluindo tamanho e complexidade do modelo, infraestrutura em uso e técnicas de otimização aplicadas. Treinado em vastos dados de texto, ele entende e produz texto semelhante ao humano. Poderíamos argumentar que a energia consumida para uma consulta do ChatGPT pode variar de um a 10 Wh. Assumindo 4,5 Wh como média, isso é cerca de 15 vezes a energia consumida por uma pesquisa padrão do Google, estimada em 0,3 Wh. Notavelmente, a indústria está trabalhando ativamente para melhorar a eficiência energética dos sistemas de IA.
A localização do data center, a disponibilidade de energia e os requisitos de energia são variáveis essenciais a serem consideradas ao criar estratégias na seleção de tecnologia. É necessário tomar uma decisão sobre a busca de novas construções ou a reforma das instalações existentes. Os data centers existentes podem adaptar partes de suas instalações para suportar cargas de trabalho de IA e, como as cargas de trabalho de treinamento de IA não são sensíveis à latência, elas podem ser processadas em instalações em áreas com custos mais baixos. Por outro lado, baixa latência, confiabilidade e escalabilidade são essenciais para o processamento de cargas de trabalho de inferência de IA, portanto, locais preferenciais podem envolver custos mais altos.
Não é surpreendente que novos desenvolvimentos de data centers, incluindo data centers dedicados de IA, estejam aumentando para centenas de megawatts, impulsionando a demanda de eletricidade para novos projetos na faixa de gigawatts. Esses requisitos substanciais de energia apresentam desafios, mas também estão surgindo oportunidades na forma de várias soluções adaptadas para atender a essas necessidades, como microrredes (recursos de energia distribuída), sistemas de armazenamento de energia, UPS com recursos de interação com a rede, turbinas, grupos geradores, células de combustível, nuclear e fontes de energia renováveis.
Os principais players do setor de data centers, incluindo a Schneider Electric, Vertiv, Eaton, ABB e Huawei, já estão oferecendo soluções inovadoras para atender às crescentes demandas de energia dos data centers. No campo das tecnologias específicas, várias empresas especializadas nessas áreas estão na vanguarda do setor.
Os principais desafios incluem:
- Evitar falta de energia para data centers
- Avaliação da confiabilidade da rede elétrica
- Melhorar a resiliência da rede elétrica
- Considerar soluções fora da rede
- Avaliação da viabilidade de uma abordagem híbrida
- Compreender e cumprir os requisitos regulamentares e de sustentabilidade
A adoção do resfriamento líquido está aumentando
À medida que os data centers lidam com cargas de trabalho mais intensivas em computação, seus requisitos de transferência de calor se tornam mais rigorosos devido à maior potência de design térmico e densidades de energia mais altas. O comportamento térmico é influenciado pela demanda de energia do equipamento de TI, dependendo da carga de trabalho processada. A refrigeração líquida surgiu como a principal solução para gerenciar a transferência de calor de novos equipamentos de TI, melhorando a eficiência operacional e reduzindo o consumo de energia. A tabela abaixo mostra os principais impulsionadores e desafios para o resfriamento líquido do data center.
Diferentes abordagens para resfriamento líquido foram testadas com sucesso, com o monofásico direto ao chip emergindo como pioneiro, facilitando soluções híbridas que combinam resfriamento a ar e líquido. Ao mesmo tempo, várias tecnologias estão amadurecendo sem um líder claro no futuro próximo, como placas frias tradicionais, microcanais microfluídicos, microconvectivos e outras abordagens. Existem também sistemas de pressão positiva e negativa, resfriamento monofásico e bifásico, imersão, spray, uma combinação de placa fria e imersão, ou métodos totalmente novos. Nos próximos anos, espera-se que a maioria dos data centers implemente, pelo menos parcialmente, alguma forma de tecnologia de refrigeração líquida.
Os governos adotaram um papel ativo na promoção de tecnologias inovadoras. Por exemplo, a iniciativa ARPA-E Coolerchips do Departamento de Energia dos EUA visa "reduzir o gasto total de energia de resfriamento para menos de 5% da carga de TI de um data center típico a qualquer momento e em qualquer local dos EUA para um sistema de computação de alta densidade". Essa iniciativa está apoiando especificamente o desenvolvimento de soluções disruptivas de refrigeração líquida.
O mercado de refrigeração líquida está sendo impulsionado por inúmeras empresas, cada uma oferecendo suas próprias soluções inovadoras. Dos principais fornecedores no espaço de resfriamento de data centers, incluindo a Vertiv, Schneider Electric, Trane, Stulz e Johnson Controls, a empresas de nicho de resfriamento líquido, como a Accelsius, Asperitas, Chilldyne, CoolIT Systems, GRC, Iceotope, Jetcool, LiquidStack, Mara, Quantas, Submer e Zutacore. Além disso, empresas como a Dell, HPE, Gigabyte, Huawei, IBM, Inspur, Lenovo, Sugon, Supermicro e Wiwynn estão fornecendo soluções de equipamentos de TI refrigerados a líquido diretamente aos usuários finais.
Os esforços em sustentabilidade e eficiência devem aumentar para os data centers
As ações e compromissos do setor de data centers, juntamente com tecnologias inovadoras e políticas governamentais de apoio, são vitais para impulsionar avanços contínuos em eficiência e sustentabilidade. À medida que o impulso para a descarbonização ganha impulso, a IA emergiu como um ator fundamental na transição para um futuro de baixa emissão ou zero líquido, com potencial para reforçar os esforços de sustentabilidade e diminuir as emissões de gases de efeito estufa (GEE). No entanto, o desafio de enfrentar a sustentabilidade e as mudanças climáticas é dificultado pela coleta e utilização fragmentadas de informações.
A IA oferece uma abordagem revolucionária não apenas processando, agregando e analisando vastos conjuntos de dados, mas também otimizando sistemas complexos com notável eficiência para melhorar a previsão. Por exemplo, o Google está pressionando por uma infraestrutura de computação mais eficiente em termos de energia e identificando práticas para reduzir significativamente a energia necessária para treinar modelos de IA. A Trillium, sua unidade de processamento tensor (TPU) de sexta geração, é mais de 67% mais eficiente em termos de energia do que a geração anterior, o TPU v5e. 1. Em 2023, a PUE média anual do Google foi de 1,10 e 100% de seu consumo anual de eletricidade foi combinado com energia renovável desde 2017.
O Google está aproveitando os modelos de IA para reduzir as emissões de GEE, incluindo um modelo de roteamento com baixo consumo de combustível, considerando o tráfego, o terreno e o motor de um veículo; um modelo hidrológico para prever inundações com até sete dias de antecedência; e um modelo de tráfego para otimizar o tempo dos semáforos, reduzindo o tráfego de parada e partida e o consumo de combustível. O Google pretende atingir emissões líquidas zero em suas operações e rede de valor até 2030.
Ao mesmo tempo em que mantemos o otimismo sobre o potencial da IA para gerar um impacto positivo na otimização e no desempenho, precisamos ser realistas sobre a pegada ambiental e o esforço colaborativo necessário para navegar nesse cenário em rápida evolução. O gerenciamento responsável do consumo de recursos da IA é crucial. Nossa compreensão de suas demandas atuais é clara, mas seu caminho futuro ainda é incerto.
Defender data centers mais eficientes em termos de energia e sustentáveis é fundamental. As estratégias incluem:
- Redução do carbono incorporado durante o projeto e construção e das emissões operacionais
- Implementação de soluções de energia e refrigeração altamente eficientes e sustentáveis - Avançar na eletrificação
- Otimizar a utilização de recursos
- Utilização de fontes de energia de baixa emissão
- Melhorar a eficiência energética
- Uso responsável da água
- Liberar o potencial de reutilização do calor residual
- Estabelecimento de práticas de economia circular
- Integrar modularidade com infraestrutura pré-projetada e pré-fabricada -Adotando materiais e tecnologias ecologicamente corretos
Os relatórios de sustentabilidade devem se tornar uma prática recomendada, completa com métricas específicas de sustentabilidade e eficiência. As partes interessadas estão cada vez mais pedindo mais transparência sobre as práticas de sustentabilidade para reduzir as emissões de gases de efeito estufa, ao mesmo tempo em que adotam abordagens mais eficientes em termos de recursos, vendo-as como uma vantagem competitiva.
Em março de 2024, a Comissão Europeia adotou um regulamento para avaliar a sustentabilidade dos data centers na UE. O objetivo é aumentar a transparência e melhorar a eficiência nos data centers, reduzir o consumo de energia e água, promover o uso de energia renovável, aumentar a eficiência da rede e facilitar a reutilização do calor residual. Os operadores de data centers com uma demanda de energia de TI instalada de 500 kW ou mais foram obrigados a relatar até 15 de setembro de 2024, novamente até 15 de maio de 2025 e anualmente a partir de então, fornecendo informações gerais do data center, indicadores fundamentais de desempenho (energia e sustentabilidade, capacidade de TIC e tráfego de dados) e indicadores de sustentabilidade (eficácia do uso de energia e água, fator de reutilização de energia e fator de energia renovável).