El chip Trainium3 de próxima generación de Amazon Web Services (AWS) probablemente consumirá 1kW de energía, según el vicepresidente de servicios de infraestructura de la compañía, Prasad Kalyanaraman.
En declaraciones al medio de noticias Fierce Networks, aunque Kalyanaraman no especificó la potencia del chip, señaló que "la próxima generación [de chips Trainium] requerirá refrigeración líquida. Cuando un chip supera los 1000 vatios, es cuando se necesita refrigeración líquida".
Anunciados por primera vez en diciembre de 2020, los chips Trainium están diseñados específicamente para "aplicaciones de capacitación de aprendizaje automático de alto rendimiento en la nube".
La cartera de chips de la compañía también incluye Graviton2, una CPU basada en los núcleos Neoverse de Arm, e Inferentia, un chip de inferencia dedicado diseñado para ayudar a los clientes a ejecutar aplicaciones de IA.
Actualmente, los únicos otros chips que alcanzan 1kW de densidad de potencia son la próxima familia de GPU Blackwell de Nvidia, aunque se rumorea que Intel está desarrollando un chip de 1,5kW.
Actualmente, casi todos los centros de datos de AWS utilizan tecnología de enfriamiento por aire, pero Kalyanaraman dijo que AWS ahora quiere adoptar tecnología de placa fría monofásica en lugar de enfriamiento por inmersión para soportar cargas de trabajo de alta densidad.
Además, dijo que la compañía también ha estado buscando optimizar aún más sus centros de datos a través del posicionamiento estratégico de racks y configuraciones de redes, trabajo que incluye asegurar que los conmutadores de próxima generación de la compañía admitan 51,2 Tbps y trabajar con proveedores de EML, láser y transpondedores para mezclar y combinar componentes ópticos.
Según Fierce Networks, Kalyanaraman no ha proporcionado ninguna información sobre cuándo estaría disponible Trainium3 o cuándo AWS comenzaría a implementar refrigeración líquida en sus centros de datos.
En septiembre de 2023, Amazon anunció que invertiría hasta 4 mil millones de dólares en la startup de inteligencia generativa Anthropic, y la compañía afirmó que Anthropic utilizará chips AWS Trainium e Inferentia para construir, entrenar e implementar sus futuros modelos.