Este invierno, todo el mundo controlará su consumo de energía, ya que los precios están disparados. Los centros de datos se preguntarán si aún pueden generar ganancias cuando los precios de la electricidad suban, y al menos dos empresas de centros de datos han cerrado, en el Reino Unido e Irlanda culpando a la crisis energética.
Pero ¿Qué impacto tiene todo el sector de los centros de datos en el consumo mundial de energía? Es una pregunta importante para los formuladores de políticas, pero parece que las respuestas que tenemos no son fiables.
La mayoría de los profesionales de los centros de datos se encogerán de hombros y dirán que las instalaciones utilizan "alrededor del dos por ciento de la electricidad del mundo". Dirán que la cifra provino de un artículo de un periódico, una firma de analistas o de las diapositivas de su propio departamento de marketing. También pueden decir que han escuchado que el uso de energía del centro de datos se está estancando, gracias a la virtualización y la nube.
Otros darán una cifra más alta, diciendo que los centros de datos usan el siete por ciento de la electricidad o más en algunos países, y van en camino de usar el 51 por ciento de la electricidad del mundo para 2030. Pregúnteles de dónde proviene la cifra y le citarán conjunto diferente de piezas periodísticas, analistas y marketing.
Esta no es una buena base para la discusión, dice el empresario y académico David Mytton, quien ha rastreado estas estimaciones hasta sus fuentes, para ver de dónde provienen las discrepancias.
Es un trabajo importante, porque los datos incorrectos pueden conducir a malas decisiones.
"Esta gran variación... sirve para confundir al público en general que quiere ayudar a abordar los problemas ambientales", dice Mytton y su colega Masao Ashtine, en un artículo titulado, "Fuentes de estimaciones de energía del centro de datos: una revisión integral" para la revista científica Joule Review. Puede conducir a esfuerzos equivocados para ahorrar energía, por ejemplo, al eliminar fotos antiguas de las redes sociales.
Más importante aún, las cifras poco fiables significan que los operadores de centros de datos no tratan el problema con la seriedad adecuada, las redes de energía no pueden planificar sus demandas, es imposible obtener una imagen real del papel de los centros de datos en el calentamiento global, y estamos viendo una serie de argumentos acalorados pero no concluyentes.
“La demanda inesperada ejerce presión sobre la transmisión de electricidad y la capacidad de distribución local, que supone un largo tiempo de anticipación para las actualizaciones y puede tener efectos secundarios en otros usuarios de la red eléctrica”, dice Mytton.
Tres distritos en el oeste de Londres han aprobado nuevos centros de datos que utilizan electricidad equivalente a decenas de miles de hogares. Como resultado, los nuevos desarrollos de viviendas no pueden conseguir conexiones.
En Irlanda, la demanda de energía aumentó un 144% en cinco años (de 1,2 TWh en 2015 a 3,0 TWh en 2020). Se prevé que los centros de datos utilicen el 27 por ciento de toda la demanda de electricidad de Irlanda para 2029, y varios operadores han retrasado o cancelado proyectos de centros de datos en el país.
Amsterdam detuvo la construcción de centros de datos en 2020 debido a la preocupación por la demanda de energía y tierra del sector.
Mientras tanto, el 15 por ciento de la electricidad danesa será utilizada por centros de datos para 2030 según los proyectos.
En todos estos casos, mejores predicciones podrían haber evitado pausas o cancelaciones que acaparan los titulares.
Cuando la electricidad se pone en el contexto del uso total de energía, las cosas se vuelven complejas. La mayor parte de la electricidad todavía se genera a partir de combustibles fósiles, por lo que el uso de electricidad de los centros de datos contribuye quizás con el dos o el tres por ciento de las emisiones globales de CO2 (una cifra basada en conjeturas).
Incluso si los centros de datos pueden optar por la energía verde, puede que no ayude. Los países tienen una cantidad limitada de electricidad de fuentes renovables: si los centros de datos la usan, hay menos disponible para calefacción y transporte, que son sectores que necesitan descarbonizarse con urgencia.
Los datos erróneos hacen que esto sea un campo minado para los responsables políticos, dejándolos a merced de alegatos especiales.
La industria de los centros de datos puede afirmar con razón que la digitalización puede ser una ayuda en la descarbonización (la llamada "huella de mano de carbono" ). Por ejemplo, si las reuniones de Zoom reemplazan los viajes de negocios, pero otros dirán que ningún sector debería obtener un pase gratuito para aumentos ilimitados en el uso de energía.
Sin datos precisos, los legisladores no pueden equilibrar estos dos argumentos.
“La falta de información precisa sobre el consumo de energía del centro de datos y cómo crecerá ya está teniendo un impacto”, advierten Mytton y Ashtine.
Cifras confiables
Para su análisis, Mytton y Ashtine recopilaron los informes sobre el uso de energía del centro de datos publicados en los últimos 16 años, un período que se remonta al lanzamiento de Amazon Web Services que dio inicio a la era de la nube en 2006.
Quieren ayudar a la industria a producir mejores cifras sobre el uso de energía: “No pretendemos criticar publicaciones individuales ni sugerir que una estimación en particular es más precisa que otra. Nuestro objetivo es el análisis amplio de los problemas metodológicos comunes dentro de este campo de investigación para que los futuros lectores puedan tener más confianza en la fiabilidad de las estimaciones”.
Cualquier informe es tan bueno como sus datos: "Nos enfocamos en la procedencia de la fuente y las entradas de datos porque son el componente fundamental que determina la veracidad científica".
Mytton y Ashtine rastrean las citas de un artículo a los anteriores, utilizando "diagramas de Sankey". (Fig. 2) Muchos de ellos se refieren al primer informe importante de energía del centro de datos, encargado por el Congreso de los Estados Unidos y elaborado en 2007 por investigadores de Lawrence Berkeley National Labs (LBNL), incluidos Jon Koomey, Arman Shehabi, entre otros. También hay un documento de 2008 de Koomey, Worldwideelectricityusedindatacenters.
La pareja verificó cualquier publicación en inglés que intentara calcular el consumo de energía de los centros de datos, ya sea a nivel mundial o dentro de una región como EE.UU. o Europa.
Se les ocurrió una lista de 46 publicaciones. Esto puede parecer sorprendentemente un resultado sorprendentemente pequeño de 16 años de investigación sobre un tema tan candente, pero hay una razón para esto. Muchas publicaciones simplemente citan o se refieren a otros.
Siguiendo estos enlaces, Mytton y Ashtine encontraron 676 "rastros de procedencia de datos" individuales o fuentes originales de datos. Muchos de estos ya no están disponibles, ya sea porque los enlaces están rotos o porque no hay rastro del documento original. Algunas eran información comercial que solo vio el investigador original, y otras no brindan una metodología sobre cómo se llegó a ellas.
El problema con los datos faltantes es que la información puede haber estado disponible en el momento de la publicación, pero no lo está ahora: “Los enlaces web no son permanentes y las páginas web utilizadas como referencias ya no están disponibles (un problema particular cuando se cita a Cisco). El problema se ve agravado por la forma en que hay pocas fuentes disponibles de datos de mercado, que generalmente solo están disponibles en informes o bases de datos privados/comerciales”.
Los informes a menudo se basan en datos secundarios. Por ejemplo, la cantidad de energía utilizada por los servidores en un año determinado a menudo se estima tomando la cantidad de servidores que se enviaron, usándolos para estimar la cantidad que estaban en uso en ese año y, a partir de eso, la cantidad probable de energía que usaban esos servidores.
Algunas fuentes fueron citadas más que otras. Por ejemplo, a pesar de la dificultad de ver sus datos de primera mano, la firma de analistas IDC y Cisco fueron citadas en el 43 por ciento y el 30 por ciento de las publicaciones, respectivamente. La dependencia real de estas cifras es mayor, porque algunos documentos citan otros anteriores que se basan en datos de Cisco o IDC sin hacer referencia explícita a ellos.
Y hay dudas sobre la fiabilidad, ya que solo un tercio de las fuentes provienen de publicaciones revisadas por pares. Otro 38 por ciento eran simplemente de "Informes", lo que podría significar publicaciones de la industria o artículos autoeditados. Algunos puntos de datos llegaron a artículos publicados a pesar de no tener año de publicación.
Los documentos manejaron los datos de diferentes maneras: algunos citaron las emisiones de carbono, otros el uso directo de la energía. Para hacer posible la comparación, todos se convirtieron a las mismas unidades: teravatios hora (TWh) por año.
Estimación y extrapolación
Vale la pena enfatizar que todas estas cifras del uso de la energía citadas son estimaciones. No existe una autoridad energética única que clasifique y agregue a todos los consumidores de energía del mundo, o incluso dentro de regiones individuales.
Los informes usan diferentes métodos para reunir sus fuentes y calcular una estimación del uso de energía del centro de datos, luego usan otros puntos de datos y suposiciones para extrapolarlos y dar una cifra probable para el uso de energía en el futuro.
También adoptan enfoques tan diferentes que compararlos puede ser una pesadilla, dice Mytton: "Koomey excluye los componentes de almacenamiento y red, Somavat y otros toman el total de EE. UU. de Brown y otros, luego lo duplican suponiendo que Estados Unidos representa la mitad del total global, Andrae y Edler excluyen las redes internas del centro de datos, en lugar de contarlas como parte de la red global en su conjunto."
Para tomar todo esto y producir cifras, existen esencialmente tres enfoques: de abajo hacia arriba, de arriba hacia abajo y extrapolación.
El modelo ascendente combinará cifras como el consumo de energía especificado de los servidores, combinará eso con estimaciones de la base instalada y lo multiplicará por la efectividad promedio del uso de energía (PUE) de los centros de datos para obtener una cifra de cuánta energía se usa en la instalación.
Está bien, pero es posible que las cifras publicadas no brinden una imagen completa. Por ejemplo, algunos informes basan el uso de energía en los datos de referencia de SPECpower, pero esto puede estar sesgado. Un informe de Van Heddeghem y sus colegas encontró que la base de datos SPECpower está sesgada hacia servidores de mayor eficiencia energética, mientras que los servidores de volumen menos eficientes son el grupo más grande por consumo de energía.
El problema empeora cuando el modelo tiene que proyectar el uso de energía en función de las cifras actuales y las tendencias observadas. Esto es complicado, porque los equipos pueden cambiar, volverse más eficientes, o de lo contrario comienzan a aparecer más sistemas que consumen mucha energía debido a un cambio a tareas más exigentes.
“Cuanto más lejos, más amplio el rango de estimaciones debido a la dificultad de tener en cuenta las mejoras en la eficiencia energética y las tendencias cambiantes en los equipos”, dice Mytton.
El artículo de LBNL de 2007 proporciona un excelente ejemplo de los peligros de la extrapolación. El estudio encontró que el uso de energía del centro de datos en los EE.UU. había crecido un 90 por ciento entre 2000 y 2005, y advirtió que esto sería insostenible a largo plazo.
La razón de esto fue que las aplicaciones en la nube habían crecido rápidamente, pero se entregaban de manera más eficiente que los mismos servicios proporcionados dentro de los centros de datos internos que la nube estaba comenzando a reemplazar.
Cambios futuros
Pero, ¿Qué ha pasado desde 2016? Es posible que las eficiencias proporcionadas por la nube estén llegando a sus límites, o que los centros de datos de hiperescala que las proporcionan estén impulsando una gran expansión en los servicios al consumidor.
En 2007, el informe LBNL descartó los centros de datos de hiperescala, considerándolos insignificantes. La secuela de ese informe de 2016 dirigida por Arman Shehabi calculó que la capacidad de hiperescala representaría más del 40 por ciento de toda la base instalada de servidores de 2020.
Parece que hay muchos más centros de datos de hiperescala en los EE. UU. (alrededor de 400 de la flota mundial de 700). “Este enfoque de los EE. UU. se ha sugerido como una razón por la cual el consumo de energía del centro de datos sigue aumentando en regiones fuera de los Estados Unidos, porque los Estados Unidos se han beneficiado de las eficiencias mejoradas de estas instalaciones”, dice Mytton.
La criptomoneda es otra gran incógnita que las estimaciones de energía tienen problemas para digerir. Surgió por completo durante el período desde 2006, ya que el documento técnico inicial de Bitcoin se publicó en 2008, y ahora el uso de energía por parte de las criptomonedas se debate acaloradamente y se considera que es tan grande como un país pequeño.
En julio de este año, Digiconomist estimó 132,05 TWh por año de consumo de energía de Bitcoin (aproximadamente el consumo de electricidad de Suecia). Otras estimaciones sitúan la cifra en 80 TWh (el consumo de electricidad de Bélgica). Si bien existen otras aplicaciones de blockchain, se calcula que Bitcoin representa dos tercios de la demanda total de energía de criptomonedas.
Vale la pena señalar que esta cifra desconocida no es solo "ruido". Estas cifras son enormemente significativas en comparación con las estimaciones de la energía total del centro de datos del mundo. Son más de la mitad del tamaño de los escenarios inferiores en la mayoría de los documentos.
Los investigadores de energía del centro de datos pueden tener problemas para obtener datos reales del mercado de criptomonedas, pero lo ignoran bajo su propio riesgo.
Incluso las nuevas tecnologías en los centros de datos son difíciles de predecir. La refrigeración líquida podría reemplazar las unidades de aire acondicionado que consumen mucha energía y que se utilizan en los centros de datos hoy en día, pero Mytton advierte que: “Existe una expectativa general de que la refrigeración líquida directa de los equipos de los centros de datos se implementará más ampliamente en los próximos siete años, pero pocos operadores actualmente tienen bastidores de alta densidad que lo justificarían”.
El modelado de arriba hacia abajo podría ser más confiable en las estadísticas actuales, porque se basa en "datos reales" en forma de totales regionales proporcionados por las estadísticas gubernamentales. Sin embargo, estos estudios son muy raros, debido a la dificultad de obtener ese tipo de datos: Mytton y Ashtine solo encontraron un estudio de arriba hacia abajo, de Jens Malmodin, que es muy respetado, pero solo cubrió Suecia.
Hay pequeñas señales de que esto puede estar cambiando. En enero de 2022, la Oficina Central de Estadísticas de Irlanda publicó las cifras de consumo de electricidad del centro de datos basadas en las lecturas reales del medidor recopiladas por la Junta de Suministro de Electricidad (ESB Networks). Se actualizará anualmente, por lo que la política futura en uno de los mercados de centros de datos más controvertidos podría basarse en buenos datos.
Sin embargo, los modelos de arriba hacia abajo no tienen ninguna magia para hacerlos mejores en la predicción de tendencias futuras.
Los modelos de extrapolación toman una línea de base de uno de los otros modelos y luego asumen que existe una correlación entre la demanda y el consumo para aplicar un factor de crecimiento.
“La mayoría de los cálculos de extrapolación se basan en la intensidad energética por unidad de datos transmitidos, con suposiciones sobre mejoras en la eficiencia energética para proyecciones futuras”, dice Mytton.
Esto puede producir diferencias. Por ejemplo, cuando Anders Andrae y Peter Corcoran tomaron las estimaciones ascendentes de Koomey, aplicaron una tasa de crecimiento mayor, porque los nuevos servicios en la nube para el consumidor impulsarán el crecimiento y aumentarán la demanda de energía, incluso si los servicios son más eficientes.
Los documentos de Andrae tienden a calcular la energía promedio utilizada por instrucción de CPU y luego extrapolar la cantidad de instrucciones de CPU que el mundo usará en un año determinado.
¿Cuánta energía?
Dada esta diversidad de datos, no sorprende que Mytton y Ashtine no presenten una cifra sólida para el uso de energía del centro de datos. En cualquier caso, ese no era su objetivo.
En total, el documento encuentra 258 estimaciones del consumo de energía del centro de datos, incluidas 179 para todo el mundo, 24 para USA y 19 para Europa. Esas cifras de "Europa" cubren otro nivel de diversidad, ya que cubren una variedad de agrupaciones dependiendo de si se incluyen la UE, el EEE u otros países. También hay estimaciones de un solo país para Alemania, Suecia y China.
Tomando las estimaciones globales, existe un buen acuerdo sobre la cantidad de energía que usaban los centros de datos en 2010, pero las estimaciones divergen en 2020 y, para 2030, están a kilómetros de distancia (Fig. 1).
“Cuanto más lejos en el futuro, más amplios son los rangos”, dice el documento. "Esto es de esperar dado que las estimaciones anteriores se pueden calcular a partir de datos reales, mientras que las estimaciones futuras deben hacer suposiciones sobre parámetros clave como la eficiencia energética y los envíos de servidores".
Mytton y Ashtine informan una diferencia de orden de magnitud entre las predicciones más pequeñas y más grandes para el uso total de energía del centro de datos en 2030: de 146 TWh a 1929 TWh por año.
La cifra real es aún mayor, porque excluyeron cinco estimaciones atípicos que pronosticaron que la energía del centro de datos aumentaría hasta 8253 TWh por año.
La mayoría de estas variaciones se deben a la imposibilidad de predecir los cambios tecnológicos. “Por un lado, la minería de blockchain de prueba de trabajo requiere una cantidad significativa de energía, pero por otro lado, muchas cargas de trabajo de TI se han movido de centros de datos empresariales ineficientes a sistemas en la nube de hiperescala más eficientes”, dice Mytton. “El teléfono inteligente se ha convertido en un dispositivo informático importante con procesadores de mayor eficiencia energética en comparación con las computadoras de escritorio, pero quedan dudas sobre el perfil de potencia de las nuevas redes celulares 5G”.
El cambio ocurre
El gran problema con las predicciones es que la extrapolación aumentará y expandirá las debilidades existentes en los datos. “Este sesgo de bola de nieve es un problema en el que las publicaciones se basan en estimaciones anteriores sin evaluar críticamente sus suposiciones y fuentes”, advierte Mytton.
Por ejemplo, es bastante crítico con el trabajo de Anders Andrae, un analista empleado por Huawei, quien publicó tres documentos de proyección en 2019, que se basan en la suposición de que el uso de energía estaría correlacionado con el tráfico de la red. Esto fue adoptado por el grupo de expertos francés, The Shift Project, en su documento Lean ICT - Towards Digital Sobriety .
“A pesar de la falta de disponibilidad de la mayoría de las fuentes que respaldan las estimaciones publicadas por The Shift Project, este informe ha sido citado por una gran cantidad de medios de comunicación principales”, dicen Mytton y Ashtine.
Esa suposición, que había un vínculo directo entre el tráfico de la red y el consumo de energía, se recicló sin examinar en la investigación desde 2013, pero fue refutada por Jens Malmodin y Dag Lunden en al menos dos artículos.
En particular, hay evidencia directa de los últimos dos años. Hubo un cambio al trabajo desde el hogar durante la pandemia que aumentó el tráfico de la red y no se informó un aumento en el uso de energía.
Vale la pena mencionar que aunque el informe de Shift Project se cita regularmente, se destaca en los diagramas Sankey de Mytton, por una razón bastante equivocada. Todas menos dos de sus principales fuentes ya no están disponibles.
Lo que necesitamos ahora
Necesitamos tener mejores datos para basar las estrategias futuras, y esto significa que las empresas privadas que administran la nube y los centros de datos deben ser más transparentes.
Mytton reconoce que Google y Microsoft han liderado el camino, con la publicación de estadísticas de alto nivel sobre su consumo de energía, compras de energía renovable y cifras de PUE.
“Otros grandes propietarios de centros de datos no son tan transparentes”, dice Mytton. “Amazon solo informa un número único para las emisiones de carbono que agrega todas sus operaciones y, por lo tanto, dificulta la separación de los centros de datos de la logística del comercio electrónico”.
Los tres proveedores de nube de hiperescala más grandes brindan a sus clientes una calculadora para mostrar la huella de carbono de sus cargas de trabajo en la nube.
“Esta transparencia es importante porque la migración de las cargas de trabajo de TI a la nube subcontrata las emisiones operativas de ejecutar esa infraestructura al proveedor de la nube”, dice Mytton. Por supuesto, también es un buen marketing, ya que los recursos de la nube generalmente consumirán menos energía que los recursos equivalentes que se ejecutan internamente.
Los proveedores de colocación y los operadores de centros de datos como Digital Realty y Equinix también brindan algunas cifras, pero la investigación de Uptime Institute sugiere que es mucho más probable que los propietarios de centros de datos informen sobre su eficiencia energética (que tiene un impacto en los costos) que sobre las emisiones de carbono y las huellas ambientales.
Las cifras reales de energía para las criptomonedas son vitales para los gobiernos que desean que la energía esté disponible para uso regular. "Se ha demostrado que las prohibiciones simples de las actividades de minería de criptomonedas provocan el desplazamiento a regiones más intensivas en carbono", advierte Mytton.
Fundamentalmente, los centros de datos se pueden construir (y se están construyendo) más rápido que la capacidad de energía. Esto lleva a las luchas de poder (literales) en Ámsterdam, Londres, Irlanda y otros lugares.
Mejores predicciones podrían conducir a una mejor planificación y tal vez evitar consecuencias negativas.
“La solución para limitar la demanda presentada por Amsterdam puede brindar certeza para que el operador de la red pueda ofrecer actualizaciones de infraestructura adecuadas, pero también impone restricciones a la capacidad de los proveedores de TI para aumentar sus servicios dentro de la región”, dice Mytton.
“Cuando la demanda supera la oferta, los precios inevitablemente aumentarán, lo que podría tener un impacto en la capacidad de las personas con ingresos más bajos para beneficiarse del acceso a los servicios digitales”.