Por Peter Panfil, vicepresidente de Energía Global en Vertiv
Las cargas de trabajo de computación de alto rendimiento (HPC) están en una trayectoria ascendente y no muestran señales de desaceleración a corto plazo. Bloomberg ha informado que la IA generativa está lista para ser un negocio de 1,3 billones de dólares para 2032, mientras que las mejoras de GPU han crecido mil veces en el rendimiento de TI en solo 10 años, con desarrollos que superan rápidamente los lanzamientos anteriores en períodos intermedios más cortos.
A medida que aumentan las cargas de trabajo, los operadores de centros de datos también enfrentan desafíos por el aumento de las fluctuaciones de energía debido al aumento repentino de la demanda energética. Esto los impulsa a innovar en la energía de sus centros de datos para soportar cargas de trabajo de HPC de manera eficiente.
Un suministro de energía confiable comienza con garantizar un tren de potencia confiable y un funcionamiento continuo. Entre los elementos del tren de potencia, los sistemas de alimentación ininterrumpida (UPS) son esenciales para la confiabilidad, la protección contra interrupciones de energía, el suministro continuo de electricidad a los equipos de TI y el mantenimiento de la eficiencia operativa.
Comprender el sistema de propulsión del centro de datos para la IA
El tren de potencia (ver Figura 1) es una estructura de distribución de energía que va desde la red eléctrica hasta los equipos de TI y que comprende cuadros de distribución, sistemas UPS, unidades de distribución de energía (PDU) y otros componentes vitales. Estas tecnologías trabajan juntas para proporcionar electricidad a los centros de datos.
Un sistema integrado promueve el máximo tiempo de funcionamiento, ofreciendo energía eléctrica confiable y soluciones de respaldo para protegerse contra cortes de energía y mantener operaciones continuas. Para comprender la eficiencia de esta configuración, exploremos el flujo de electricidad y examinemos cómo cada tecnología contribuye al funcionamiento general:
- Red eléctrica o fuente de energía renovable: de aquí proviene la energía para la infraestructura del centro de datos.
- Interruptor de transferencia automático: cambia sin problemas a fuentes de energía de respaldo en caso de un fallo de energía primario, lo que garantiza un funcionamiento continuo. Además del SAI, estas fuentes de energía de respaldo incluyen:
- Pilas de combustible: funcionan con hidrógeno y pueden actuar como fuentes de energía primarias o redundantes.
- Baterías de larga duración: ofrecen mayor capacidad de energía y resistencia que las baterías UPS tradicionales.
- Tablero de distribución crítico: la primera línea de defensa contra fallos externos, como fluctuaciones de voltaje de la red eléctrica o cortocircuitos, que dirige la energía a la red del centro de datos. También sirve como medida de seguridad vital, ya que aísla el equipo durante el mantenimiento o las reparaciones.
- UPS: proporciona energía de respaldo crítica durante cortes de suministro eléctrico. También actúa como amortiguador, filtrando cualquier fluctuación o pico de voltaje proveniente de la red. Recurre al sistema de almacenamiento de energía de la batería (BESS) cuando falla la red eléctrica.
- BESS: almacena la energía y suaviza las variaciones de suministro a corto plazo. Al igual que el SAI, también puede almacenar energía como reserva energética para una zona localizada.
- Interruptores de transferencia estáticos: proporcionan transferencia inmediata de cargas eléctricas entre fuentes de energía, manteniendo así una energía continua y confiable.
- Unidades de distribución de energía (PDU) y panel remoto: distribuyen la energía de manera eficiente a varios nodos informáticos y sistemas de almacenamiento.
- PDU para busway y rack: suministran energía a los equipos de TI, satisfaciendo con precisión la demanda de los recursos informáticos instalados.
Las cargas de trabajo de IA están redefiniendo la dinámica energética en TI, lo que agrega nuevos desafíos a la capacidad de la red y la complejidad operativa. A pesar de las crecientes densidades de racks, la infraestructura y las tecnologías energéticas de los centros de datos siguen siendo las mismas. Esta situación desafía a los propietarios y operadores de centros de datos a garantizar que todos los activos del tren de potencia entreguen energía sin problemas desde la red eléctrica a los componentes críticos de toda la infraestructura.
El sistema UPS es fundamental para mitigar las interrupciones durante los cortes de energía, lo que garantiza un flujo de electricidad continuo y confiable. Elegir el sistema UPS correcto puede ayudar a los operadores de centros de datos a administrar la carga de energía que generan las aplicaciones de HPC.
Cómo los UPS gestionan la carga de IA y HPC
La unidad UPS es la columna vertebral del sistema de suministro de energía del centro de datos y cumple una función indispensable en la estabilización del suministro de energía. Las unidades UPS garantizan que las tareas computacionales críticas puedan continuar sin interrupciones al mitigar las fluctuaciones de energía y brindar respaldo inmediato durante los cortes de energía.
Proporciona potencia constante y equilibrada.
Los sistemas de energía trifásica pueden proporcionar niveles más altos de energía equilibrada de manera constante. Cada corriente en un sistema trifásico está separada por 120 grados (consulte la Figura 2), lo que garantiza que cuando una fase alcanza su pico, las otras dos siguen aportando energía, lo que evita cualquier caída en la entrega.
Por otra parte, las ramas que transportan corriente de los sistemas de alimentación de CA monofásica siempre están separadas 180 grados (véase la Figura 3). En consecuencia, hay ciclos en los que no se suministra energía a la carga, lo que hace que solo sea adecuado para aplicaciones domésticas y comerciales ligeras para un suministro de energía decente.
La capacidad del sistema trifásico de suministrar energía de manera constante y sin interrupciones lo convierte en una opción ideal para aplicaciones informáticas de alta potencia. El suministro de energía constante y equilibrado puede soportar las demandas a menudo fluctuantes de las cargas de trabajo de IA sin comprometer el rendimiento ni causar daños a los equipos críticos. También permite un mejor uso de la energía, lo que reduce el desperdicio de energía y aumenta la eficiencia.
Los UPS trifásicos de gran tamaño de Vertiv utilizan algoritmos avanzados de control de inversores que muestrean y neutralizan activamente los armónicos activos presentes en las cargas, abordando así los desafíos que plantean las cargas de IA con picos de tensión y su alto contenido de armónicos. Estas soluciones garantizan un suministro de energía más limpio, lo que mejora el rendimiento y la confiabilidad de los sistemas que ejecutan cargas de trabajo de IA complejas.
Permite una alimentación de CA continua y de alta calidad.
Los sistemas UPS de doble conversión en línea proporcionan energía de CA continua y de alta calidad, esencial para el funcionamiento sin problemas de TI. La conversión entre CA y CC protege a estos sistemas contra problemas de voltaje y evita daños en los equipos. Además, cuentan con un bypass interno robusto que reduce el riesgo de tiempo de inactividad durante el mantenimiento o fallas.
Los sistemas UPS en línea aíslan las cargas críticas de las irregularidades en el suministro eléctrico, lo que protege contra todos los problemas de suministro eléctrico y garantiza que los sistemas de IA funcionen con energía limpia y estable. Su capacidad para mantener una salida de onda sinusoidal perfecta y proporcionar un tiempo de transferencia cero a la batería durante los cortes es esencial para evitar la pérdida de datos y garantizar operaciones ininterrumpidas.
La integración de la tecnología de refrigeración líquida en los sistemas UPS es crucial para garantizar un suministro de energía continuo, lo cual es vital para las cargas mecánicas en la distribución de refrigerante. Los sistemas de refrigeración confiables mantienen temperaturas óptimas para los equipos y las instalaciones. Con sistemas UPS mejorados, los operadores de centros de datos pueden garantizar que los mecanismos de refrigeración continúen funcionando sin interrupciones durante los cortes de energía, lo que enfatiza la necesidad de energía constante en entornos informáticos de alta densidad.
Transiciones sin problemas a soluciones de almacenamiento de energía
Los sistemas UPS interactivos con la red funcionan con tecnologías de almacenamiento de energía como BESS para ayudar a gestionar las necesidades de electricidad de las aplicaciones de IA. Siempre garantizan la energía, incluso durante cortes de energía o cuando la demanda es alta. Con capacidades de reserva de frecuencia rápida (FFR), las unidades UPS responden rápidamente a las fluctuaciones de la oferta y la demanda, lo que permite una transición fluida a la energía almacenada sin interrupciones. Esto es vital para los centros de datos con cargas de trabajo intensivas de IA y HPC.
BESS trabaja con el SAI para equilibrar la carga de la IA, almacenando energía adicional cuando la demanda es baja y liberándola durante los períodos pico para mantener las operaciones de la IA alimentadas (también llamado "reducción de picos"). Esta combinación evita sobrecargas, mantiene la eficiencia operativa y reduce la dependencia de fuentes de energía tradicionales.
Potencie su implementación de IA/HPC
Los sistemas UPS de alta capacidad pueden ayudar a gestionar las demandas de carga de IA de los centros de datos, y funcionan como una sólida columna vertebral para todo el tren de potencia. Sin embargo, prepararse para los requisitos de las crecientes cargas de trabajo de IA y HPC requiere más que un simple UPS confiable.
Vertiv ofrece una solución integral que brinda soporte y experiencia integrales a los centros de datos que manejan IA y otras cargas de trabajo de HPC. Ofrecemos una amplia gama de categorías de productos y tecnologías industriales para IA/HPC. Ya sea que necesite tecnologías completamente nuevas o sistemas modernizados para densidades más altas, lo tenemos cubierto.