Incluso después de tres o cuatro años de exageración, todavía hay muchas preguntas sobre la computación Edge: el movimiento para poner pequeños micro centros de datos cerca de los usuarios finales y las aplicaciones, para proporcionar potencia de procesamiento de baja latencia.
Pero una de las preguntas más importantes, podría ser sorprendente: "¿Qué sucede cuando vas a una instalación de Edge ... y abres la puerta?"
Eso suena trivial, pero resulta crucial para la implementación del centro de datos. Y la mejor respuesta hasta ahora proviene de ASHRAE, el organismo de la industria que literalmente escribió el libro sobre la construcción de centros de datos confiables.
Un problema técnico
El nombre de ASHRAE significa Sociedad Estadounidense de Ingenieros de Calefacción, Refrigeración y Aire Acondicionado, y hace 20 años se pidió a sus miembros que equiparan una nueva clase de edificios especiales diseñados para albergar equipos de TI.
El Comité Técnico 9.9 de ASHRAE consideró el flujo de aire, la temperatura y la humedad requeridos por el equipo dentro de esos nuevos centros de datos.
"La mayoría de los edificios están ahí para servir a las personas", dice Jon Fitch, científico de datos y miembro de TC 9.9. “Pero los centros de datos y las instalaciones de misión crítica están ahí principalmente para servir equipos. Es una visión muy, muy, muy diferente de lo que un edificio puede hacer".
TC 9.9 produjo una serie de libros y recomendaciones que se han convertido en la Biblia para los edificios de los centros de datos y se han incorporado a las regulaciones de construcción. Están en uso en todo el mundo porque, a pesar del "estadounidense" en su nombre, ASHRAE ha sido internacional desde que se formó en 1894.
Hay una máquina en acción, que nos dice que los centros de datos centralizados no son suficientes. Necesitamos con urgencia construir muchos más centros de datos pequeños fuera de los edificios de ladrillo y cemento, en edificios más pequeños, gabinetes y contenedores que estén cerca de teléfonos móviles, personas, vehículos autónomos y los sensores utilizados por Internet de las cosas.
El bombo de Edge dice que las nuevas aplicaciones necesitan una respuesta rápida, que solo puede ser entregada por estas instalaciones de Edge.
La publicidad también asume que, debido a que es necesario, esto se puede cumplir. y utilizará el mismo equipo de TI y al mismo costo que en un centro de datos físico.
Enfrenta la realidad
Pero hay un problema con eso. Jon Fitch es el autor principal del equipo que explica qué es eso en el nuevo "Technical Bulletin Edge Computing: Considerations for Reliable Operation" de ASHRAE. Es un documento breve, que destila diez años de trabajo.
“Edge está impulsado por la proximidad a los datos, no por factores como la prevención de desastres. Se trata de acercar las computadoras a los clientes y los datos”, explica. Los centros de datos tradicionales se pueden ubicar usando un mapa que muestra el riesgo de desastres naturales.
Los centros de datos Edge no tienen esa opción: “Estos centros de datos Edge pueden ir a un área metropolitana sucia donde hay todo tipo de contaminación y gases de escape de vehículos. Podrían ir a un área agrícola, podrían ir a un área polvorienta donde hay vientos estacionales que hacen estallar tormentas de polvo ”.
Los centros de datos perimetrales también suelen ser pequeños y modulares, en contenedores de envío, módulos del tamaño de una cabina de teléfono o incluso unidades más pequeñas, y esto tiene consecuencias: “Muchos elementos que no son un problema para los centros de datos tradicionales son problemas reales para los pequeños centros de datos."
Las redes de telecomunicaciones ya están implementadas en Edge, por supuesto, pero utilizan equipos reforzados. Especificaciones como NEBS, definido por AT&T en la década de 1970, significan que el kit es resistente a cambios de temperatura, humedad, contaminación del aire y polvo.
Los equipos reforzados son demasiado costosos para la implementación masiva de TI en el perímetro que se prevé en la actualidad. De hecho, se está pidiendo a los ingenieros que desplieguen equipos en un entorno hostil para el que no fueron diseñados.
“Hay dos escuelas de pensamiento”, dice Fitch. ”Uno es que puede endurecer el hardware a un costo más alto. O puedes cuidar el medio ambiente. Creo que el boletín técnico que hemos escrito proporciona un modelo bastante bueno de cómo se puede controlar el medio ambiente y utilizar una estructura de menor costo, equipos de TI comerciales listos para usar [COTS] para aplicaciones de Edge. Ese es el tipo de equipo al que están acostumbrados la mayoría de los proveedores.
"El desafío al que nos enfrentamos hoy es cómo logramos resultados de telecomunicaciones con equipos COTS económicos. Nuestro boletín le informa los pasos que debe seguir para diseñar esos centros de datos Edge, de modo que sean compatibles con equipos de TI comerciales listos para usar y lograr tiempos de actividad similares".
Explica: “Compare por un momento un pequeño centro de datos de Edge modular con un gran centro de datos en la nube de ladrillo y cemento. El centro de datos en la nube probablemente tenga al menos tres puertas entre el entorno exterior y el equipo de TI. La distancia entre esas puertas es probablemente de 30 metros o más, y no hay forma de que todas esas puertas se abran al mismo tiempo.
“Si abre la puerta de un rack en un centro de datos, ¿qué sucede? Nada."
Es diferente en un centro de datos Edge, donde el entorno exterior ingresa al gabinete en el momento en que se abre la puerta, sin pasar por el HVAC y la filtración: "No siempre se puede elegir el lugar y el horario de su servicio. Si tiene una ventisca invernal y su centro de datos Edge falla y necesita servicio, debe salir. Y cuando abres esa puerta, el aire frío del invierno entra de inmediato, o puede ser aire del desierto, aire polvoriento o aire húmedo del rocío de la mañana".
Sobrevivir a estos efectos significa algo más que diseñar físicamente las instalaciones de Edge. Cuando ASHRAE desarrolló sus recomendaciones para edificios, descubrió rápidamente que los fabricantes definen lo que puede hacer con su kit de TI en las garantías. Estas garantías ahora incluyen una concesión por una cierta cantidad de tiempo fuera de las condiciones ideales, las llamadas "excursiones". Si algo sale mal y no puede demostrar que mantuvo el equipo dentro de su tolerancia, anulará la garantía.
“La mayoría de las especificaciones de los equipos de TI para la temperatura y la humedad están escritas para un funcionamiento en estado estable 7x24 en un centro de datos físico donde las condiciones ambientales están bien controladas”, dice Fitch. Cuando abre la puerta a un centro de datos de Edge pequeño, puede cambiar la temperatura y la humedad.
“Muchos equipos de TI tienen la capacidad de registrar la temperatura”, señala. Los discos duros tienen un sector de datos SMART [Self-Monitoring, Analysis and Reporting Technology] que registra la temperatura periódicamente. La mayoría de los servidores tienen una captura de datos de temperatura. Y entonces habrá una discusión entre el cliente y el proveedor de equipos de TI. Estos datos se están registrando y, en algún momento, alguien lo notará y dirá: "Oye, el 16 de octubre abriste la puerta de ese centro de datos Edge y ese aire frío entró y tu equipo cayó por debajo de las garantías nominales".
Los técnicos deben avanzar con cuidado. La humedad y el punto de rocío no son un problema obvio, advierte Fitch: “Un técnico puede reparar un centro de datos Edge en una hermosa mañana a 23 ° C en Atlanta. Piensa que es un gran día para ser técnico de centro de datos, pero Georgia tiene mucha humedad y hay rocío en el césped. Cuando el técnico abre la puerta, el aire húmedo entra en la instalación, que está a 20 ° C. En cuestión de minutos, su equipo está cubierto de condensación".
La solución es llevar un monitor portátil de temperatura y humedad: “Las condiciones ambientales como la irrupción no son obvias. Es posible que deba capacitar al personal de servicio sobre cómo interpretar las lecturas para determinar si la condensación será un problema. Un monitor de $ 100 a $ 200 podría ahorrar $ 1000 ".
Alternativamente, los técnicos pueden usar las lecturas de temperatura del propio equipo de TI, pero lo principal es la conciencia: “Estas no serían preocupaciones en un centro de datos físico, pero deben ser parte de la mentalidad del técnico de servicio de Edge."
Usa una carpa
Para abrir la puerta de forma segura, Fitch dice que tendremos que trabajar bajo una mortaja: "La mejor solución es algo simple como una pequeña carpa que encierre la puerta y aún proporcione suficiente espacio para trabajar".
Otra solución podría ser un acordeón entre el gabinete Edge y un compartimiento con aire acondicionado en la parte trasera del camión de servicio: "Estas son ideas disparatadas, pero cosas en las que debemos pensar".
La carpa ayudará con otros problemas como la contaminación del aire: "¡Eres dueño de la tierra, pero no eres dueño de la corriente de aire!" advierte, y la contaminación puede ser estacional. Los cultivos solo se rocían en ciertas épocas del año, los sistemas de calefacción de carbón pueden encenderse o apagarse y los vientos dominantes pueden cambiar.
La contaminación y la corrosión son riesgos de falla acumulativos. El material que ingrese en una ocasión permanecerá allí y se acumulará. Además de causar cortocircuitos, las materias extrañas en los centros de datos Edge pueden causar corrosión.
Hay monitores de corrosión en tiempo real disponibles y, lo que es más importante para las instalaciones de Edge, se pueden conectar en red y comprobar de forma remota. “Desea que se le avise con anticipación sobre los problemas de corrosión, con suficiente tiempo de espera para instalar la filtración de reducción de la corrosión”, dice Fitch.
“Si espera hasta ver fallas relacionadas con la corrosión, es probable que todo su equipo de TI se haya visto comprometido y tendrá que vivir con una alta tasa de fallas o realizar una operación costosa de extracción y reemplazo con equipo nuevo. Tampoco es una buena opción".
Los centros de datos a gran escala tienen filtros para mantener el polvo, pero las instalaciones de Edge no: "El polvo generalmente se elimina mediante filtración de clase MERV 11 y 13", explica Fitch. "Cuando abre la puerta a uno de estos centros de datos modulares, evita por completo la filtración".
Este polvo se acumula. “Podrías decir '¿Por qué no puedo simplemente tomar aire comprimido y soplarlo?' Bueno, aquí está el problema. Una gran cantidad de polvo se compone de dióxido de silicio, pero parte del polvo también contiene yeso, sales y otros materiales. Si se colocan dentro de un contacto, como un DIMM o un procesador, y les prestas un servicio, lo que puedes hacer es untar las partículas en el contacto. Lo comparo con untar mantequilla de maní o Nutella en una tostada. Es muy espeso y viscoso y, caramba, si quieres quitarlo de la tostada, ¡es bastante difícil de hacer!"
Esto empeora, dice, por la gran cantidad de contactos. Un servidor de 2U puede tener 10.000 contactos (288 por DIMM, 3600 por CPU y 64 o 98 por PCIe). “Algunos de estos contactos son redundantes, como la energía y la tierra, por lo que no son críticos. Pero muchos de estos son contactos de punto único de falla. Entonces, si se mancha ese contacto, ocurre un error".
Menor eficiencia
Estas consideraciones significan que los centros de datos de Edge terminan reduciendo la eficiencia general de la flota de centros de datos, dice Fitch.
Los constructores de centros de datos están trabajando para eliminar el aire acondicionado de las instalaciones físicas y minimizar los equipos redundantes, pero los centros de datos de Edge deberán diseñarse para ser confiables.
Esto significa algún equipo redundante: "Si tiene un centro de datos remoto que va a tardar varias horas o más en alcanzar, debe tener algún nivel de conmutación por error y redundancia. Piense en un centro de datos de Edge del tamaño de una cabina telefónica, tal vez tenga un rack de 42U y 20U de cómputo en él, es decir, diez servidores de 2U. Si alguno de ellos falla, solo tiene el 90 por ciento de su capacidad de procesamiento y necesitará un repuesto de conmutación por error. Las fallas o interrupciones del servicio en un centro de datos pequeño pueden tener un impacto mayor que en un centro de datos en la nube grande, que puede tener decenas de miles de servidores disponibles".
La mayoría de las instalaciones de Edge tendrán algún tipo de aire acondicionado: “La mayoría de las regiones del mundo tienen algún tipo de temperatura o humedad extremas y necesitarán algún tipo de aire acondicionado o control ambiental mecánico. Si el 20 por ciento de la flota de su centro de datos ahora está dispersa, y todos esos centros de datos Edge tienen aire acondicionado de expansión directa (DX), eso puede reducir la eficiencia de su flota. Es difícil implementar economizadores del lado del aire o del agua en los centros de datos de Edge".
Otro desafío es la distribución de energía y el respaldo en un espacio pequeño: “Los UPS o baterías que ubicaría en un área gris separada en un gran centro de datos físico, ahora pueden residir en el mismo gabinete que el equipo de computación. Ese es un desafío de ingeniería adicional. Por ejemplo, las baterías deben tener muy buena ventilación para asegurarse de que no haya acumulación de gases como el hidrógeno. Tiene equipos diferentes en el mismo entorno. Necesita controlar el entorno con el rango de especificaciones más estrecho de cualquier equipo de instalaciones que tenga".
Los centros de datos de ladrillo y cemento pueden tener un pasillo caliente contenido, dice, "pero ¿cómo se implementa eso en una instalación del tamaño de una cabina telefónica?"
¿Pueden ayudar las nuevas tecnologías?
Dadas estas limitaciones, algunos proveedores han sugerido que el Edge podría ser un caso de uso innovador para la refrigeración líquida. Argumentan que los sistemas de enfriamiento líquido no necesitan pisos elevados o pasillos cerrados, y pueden operar silenciosamente en entornos junto a las personas. Fitch advierte contra la incorporación de nueva tecnología para instalaciones remotas.
“La refrigeración líquida no está lista. Las tuberías y los tubos son una oportunidad para las fugas, y un centro de datos de Edge puede estar a horas o días de un técnico”, dice.
Si bien los sistemas de refrigeración líquida se han desarrollado rápidamente, sus tuberías y tubos no tienen suficientes horas de servicio para ser utilizados de forma remota todavía: “Para instalaciones que son bastante remotas, se deben abordar las nuevas tecnologías de refrigeración de forma cautelosa y conservadora."
Del mismo modo, mientras que el experimento submarino Natick de Microsoft ha demostrado que es posible ejecutar un centro de datos durante años sin abrirlo, Fitch dice que la operación de apagar las luces aún no está lista: “Ese es un objetivo aspiracional, pero no creo que sea muy práctico ahora mismo. Los DIMMS deben restablecerse y los servidores y el software deben actualizarse."
Todo esto puede parecer abrumador y parece que inevitablemente hay pérdidas de eficiencia. Pero hay elecciones que un operador tendrá que tomar: “O endureces el hardware y tienes un punto de costo más alto, o cuidas el medio ambiente y puedes continuar usando el equipo COTS.
ASHRAE cree que el boletín permitirá a los operadores hacer precisamente eso, y se ha esforzado por comunicar la información urgente de manera sucinta. “Este boletín técnico es una nueva forma de comunicación, que ASHRAE utilizará en el futuro. Está ahí para comunicar de manera sucinta y rápida información procesable que la industria necesita. Estamos tomando la información de lo que solían ser informes académicos de 30 a 50 páginas, y la estamos reuniendo en un documento nítido y procesable de 10 páginas".
Tendrá que comunicarlo bien porque, a diferencia del trabajo original de ASHRAE TC 9.9, los constructores del centro de datos trabajarán con él directamente, no a través de códigos de construcción y regulaciones legalmente vinculantes. “No veo esto como algo que se incorporará y convertirá en legislación, como se ha hecho con los edificios”, dice Fitch.
“Son pequeñas instalaciones. Por eso, creo que mantener esta información a nivel de usuario tiene mucho más sentido ".