Gestionar un centro de datos de forma remota siempre ha tenido sentido. Las instalaciones a menudo se encuentran en ubicaciones apartadas y es más rápido y económico solucionar los problemas de forma remota en lugar de tener un ingeniero en el sitio.
En el extremo, es posible ejecutar un centro de datos prácticamente sin actividad del personal, la llamada instalación de "luces apagadas". Pero la realidad a menudo no ha estado a la altura de esta promesa. Por un lado, las herramientas para proporcionar control remoto a menudo han sido difíciles de integrar. Por otro lado, los proveedores de coubicación y sus clientes se han mostrado reacios a confiar en los sistemas remotos, prefiriendo tocar los servidores y otros equipos directamente.
En 2020 todo eso cambió, por necesidad. A medida que avanzamos, grandes partes del mundo entran y salen del bloqueo, con restricciones de viaje aún vigentes. Entrar en un centro de datos es incómodo, aunque el personal del centro de datos generalmente se clasifica como "esencial" y está exento de las restricciones, porque la infraestructura digital es esencial para la economía. Pero los expertos en confiabilidad del centro de datos del Uptime Institute han aconsejado que las visitas a una instalación deben minimizarse.
En las instalaciones de coubicación, los clientes deben visitar menos el sitio, dice el vicepresidente senior de Uptime Fred Dickerman, y el acceso del personal también debe restringirse y manejarse con mucho cuidado: “Cuando los equipos entran y salen del sitio, deben hacer traspasos a distancia o por teléfono."
En marzo, el gigante de colocación Equinix respondió a los bloqueos que se estaban aplicando y restringió severamente el acceso de los clientes a sus centros de datos. A los visitantes, clientes, contratistas y personal no crítico de Equinix se les prohibió la entrada a las instalaciones de Equinix IBX en Francia, Alemania, Italia y España, y otros países pasaron a un régimen de solo citas.
Este movimiento impuso un gran requisito a la funcionalidad remota, que puede que se haya utilizado raramente en el pasado o que se haya implementado de manera incompleta. Los productos para la gestión de la infraestructura del centro de datos (DCIM) o la gestión de servicios (SM) se presentan como una solución completa, pero la mayoría delata sus orígenes en un sector u otro, o necesitan una implementación cuidadosa para entregarse por completo.
Cuando golpeó la crisis, aquellos que tenían sistemas completamente funcionales y una cultura de uso de las herramientas disponibles, tenían una ventaja para enfrentar la crisis.
Cuando el mundo cambió
Brent Bensten, director de tecnología de QTS Data Centers, se considera afortunado. La empresa de centros de datos trata con una variedad de empresas, desde pequeñas hasta grandes, pero tiene una plataforma de prestación de servicios (SDP) desarrollada a partir de Carpathia Hosting, una adquisición de 2015.
El bloqueo creó un cambio significativo en el comportamiento del cliente, dijo. La cantidad de inicios de sesión en SDP aumentó en un 30 por ciento en las primeras tres semanas de restricciones, y los principales usuarios casi duplicaron la cantidad de tiempo que pasaron en el sistema, pasando de 36 minutos a 62 minutos.
Durante el mismo período, los clientes aún eran bienvenidos en el sitio, pero las visitas disminuyeron en una proporción similar al aumento del tráfico en el SDP. “Queremos que vengan si es necesario”, nos dijo Bensten en abril. "Pero la Covid-19 es un caso perfecto para usar las herramientas, por lo que pueden hacer de forma remota lo que solía hacerse en el sitio".
Las estadísticas son granulares, ya que los diferentes sitios tienen un número de visitantes muy variable, según el perfil de los clientes y su etapa de implementación. El sitio más grande de QTS en Atlanta podría tener entre 400 y 700 visitantes en un mes, pero al normalizar el período con uno anterior, calcula que esto se redujo alrededor del 40 por ciento.
Si los clientes se dan cuenta de que las visitas innecesarias son un riesgo, es posible que nuevos procedimientos contribuyan a ello. “No hemos tenido que poner en práctica un fuerte rechazo en ningún sitio. Exigimos la divulgación de dónde han estado los visitantes, utilizamos datos biométricos y toallitas desinfectantes cuando tocan cosas".
La reducción en las visitas de los clientes es aún más sorprendente en un contexto de hardware del centro de datos que trabaja más duro para satisfacer las mayores demandas de tráfico: “Según todas las estadísticas que tenemos, el consumo de energía aumenta y el ancho de banda aumentan significativamente. Con todos esos indicadores en aumento, normalmente vería aumentar los perfiles de visitantes ".
QTS tuvo la suerte de tener un SDP con todas las funciones, dijo Bensten: “Es de alto contacto, de gran necesidad, que las personas obtengan lo que necesitan en el centro de datos sin tener que ingresar en él. Es la única forma de integrarse con QTS, desde la compra del servicio. Está disponible para iPhone, a través de un portal o con una API para que pueda hacer todo mediante programación".
Ese rango es importante. Las empresas más pequeñas, como las startups en la nube, solo necesitan una verificación rápida de una aplicación, mientras que los grandes hiperescaladores tienen los recursos para aprovechar al máximo el acceso programático: “La forma en que se acostumbran es muy diferente. Un gran cliente de hiperescalador con 1MW de capacidad moverá cargas para consumir menos energía y mantener el servicio de manera confiable, según los datos que compartimos a través de la API. En el viejo mundo, habrían tenido que ir al sitio para hacer eso".
Podría esperar que los grandes jugadores expertos en tecnología se adapten al uso remoto más fácilmente, pero eso no es lo que encontró Bensten: "La reducción de visitas es generalizada para todos los tamaños de clientes, incluidas las empresas y los negocios gubernamentales".
Una verificación remota con el SDP en realidad puede ser más eficaz que una visita al sitio, ya que tiene acceso a más datos, dijo: "Tenemos un lago de datos masivo construido a lo largo de los años, basado en los datos que recopilamos de los millones de sensores en nuestro espacio para el cliente".
También incluye datos mundiales más amplios, como los patrones climáticos, y analiza de manera efectiva el "clima" dentro del centro de datos: "Tenemos un equipo de científicos de datos que utilizan análisis avanzados, por lo que podemos proyectar nuestro consumo de energía en intervalos de siete días para predecir el futuro patrones, y el lago de datos puede ser explotado tanto por nuestros clientes como por nosotros".
Viviendo de forma remota
Si el control remoto es bueno para los clientes, también es bueno para el personal, por lo que QTS implementó el trabajo desde casa siempre que fue posible, utilizando una vista diferente de las mismas herramientas: “Nuestro centro de soporte NOC ahora está trabajando de forma remota, usando un mapeador con una vista 3D de todos nuestros edificios hasta los gabinetes de los clientes ".
Por supuesto, las herramientas no pueden hacer todo, pero cuando algo físico tiene que suceder, lo mejor es que el personal del operador entre y lo haga por el cliente, dirigido por el centro de soporte, dijo Bensten: “Nuestros empleados son considerados trabajadores esenciales. Cuando necesitamos cosas físicas, nuestras 'manos inteligentes' pueden hacer el trabajo físico".
El trabajo lo dirige el SDP, pero el personal abre físicamente los gabinetes: "Todavía no tenemos robots". El personal también opera un patrón de turnos ligeramente diferente, pero no hay un cambio dramático, dijo Bensten: "El número de nuestra gente en el sitio a la vez no ha cambiado".
QTS también comparte la seguridad de su edificio, brindando a los clientes acceso a las señales de CCTV para sus recintos, dijo Bensten: "Es Nest para sus jaulas, puede ver quién entró y quién se fue". El operador tiene la misma capacidad extendida a las áreas compartidas, por lo que puede rastrear al personal y los clientes desde la entrada a través de la trampa hasta las salas de datos.
La gestión remota plantea problemas de demarcación para los proveedores de coubicación y sus clientes. Los clientes quieren saber sobre las instalaciones del edificio, como refrigeración y energía, pero están bajo el control del operador. Mientras tanto, el operador traza una línea al mirar dentro de la TI a los sistemas operativos y las cargas de trabajo, dejando esos para que los administre el cliente.
“Capturamos la TI como activos, como servidores y controladores de almacenamiento, para que los clientes puedan cargar configuraciones de IP y VLAN. Nuestra tecnología no interroga a sus sistemas operativos invitados".
Ambos grupos ven una vista diferente: "Nuestros empleados necesitan ver una imagen macro, mientras que los clientes necesitan ver una vista micro más detallada".
Las instalaciones más pequeñas también obtuvieron una ventaja en el trabajo remoto, simplemente debido a los gastos generales que implica cubrir múltiples ubicaciones pequeñas.
“Toda nuestra premisa comercial se basó en centros de datos apagados”, dijo Lance Devin CIO de EdgeConneX, un proveedor de colocación que se especializa en instalaciones construidas bajo pedido para ciudades más pequeñas de todo el mundo. “Tenemos sitios de 2MW, no gigantes de 100MW. No puedo permitirme poner a tres ingenieros, 17 personas de seguridad y dos personas de mantenimiento en un sitio como ese".
Con 600 de estas instalaciones, la empresa tenía un incentivo para habilitar el control remoto desde el principio. "La justificación comercial ya estaba ahí: es más rentable y más barato". Y avanzar más al borde, con la posibilidad de emplazamientos de 100 kW o 200 kW, hizo que la gestión remota fuera más importante.
Pero la crisis del Covid-19 proporcionó un entrenamiento para la administración de la infraestructura del centro de datos (DCIM) EdgeOS de la empresa, EdgeOS, dijo Devin a DCD en abril. “Esta es la forma en que manejamos nuestro negocio. Esto no fue un cambio ".
Los sistemas administran el equipo de EdgeConneX y el equipo del cliente en los racks, pero las vistas de datos deben administrarse. A pesar del tamaño de sus instalaciones, EdgeConneX es un proveedor mayorista que trata con jugadores en la nube, "Nuestros clientes no quieren que sepamos lo que hay entre sus cosas o viceversa".
Entonces, el sistema de EdgeConneX administra de forma remota equipos como los sistemas de enfriamiento Liebert, que tienen mantenimiento predictivo computarizado, mostrando los detalles del equipo, cuándo fue certificado y probado, y su historial, dijo Devin.
SCADA monitorea todo cada 100 ms, detecta cuando algo está fuera de línea y luego verifica la causa raíz, por ejemplo, encuentra el panel de conexión remoto defectuoso (RPP) aguas arriba de las PDU que repentinamente muestran errores. El sistema habla con los proveedores del hardware: "Nuestra gente de operaciones no tiene que ponerse en el medio, el sistema envía automáticamente un ticket directamente a los proveedores"
El sistema también se comunica con el cliente. Conoce la ubicación y el estado de las PDU y otros kits, qué racks sirven, quiénes se verán afectados y si afectará su acuerdo de nivel de servicio (SLA). "El sistema de emisión de boletos les dice a nuestros clientes que el proveedor está trabajando en él, automáticamente".
EdgeConneX también permite a los clientes monitorear visualmente su equipo, pero integrando sus propias cámaras CCTV en el sistema. "Cuando piensas en todo lo que has visto en la automatización y el trabajo remoto. Tienes todo lo que necesitas a tu alcance”, dijo Devin.
Las vistas y los datos se controlan cuidadosamente: “Un inquilino solo puede ver Denver, y dentro de eso, su carga en tiempo real y sus tickets. Ven sus gabinetes ".
Las visitas reales son un problema en una instalación con poco personal, con pandemia o sin pandemia. “Construimos un mantrap y un sistema de buzón de llamadas que funcionaba con el sistema de seguridad, de modo que podemos permitir que la gente ingrese de forma remota”, dijo Devin. "Les tomamos una foto y luego pedimos a un sistema de desafío la autenticación dual o una lectura biométrica remota".
Su pase tiene una identificación con foto, pero debe emitirse de forma segura, y el reconocimiento biométrico debe ser de bajo mantenimiento para un sitio sin luces: "Probamos un escáner de iris", dijo Devin, pero era demasiado complejo, ya que los visitantes tenían para repetir el escaneo a diferentes distancias.
Las huellas dactilares fueron rechazadas porque los escáneres se engrasaban. EdgeConneX utiliza una imagen vascular del dorso de la mano del visitante: "no tocan la lente".
Es un sistema complejo que EdgeConneX armó a partir de soluciones parciales. "Miré cuatro productos DCIM listos para usar", dijo Devin. “Les garantizo que cualquier sistema hizo dos cosas realmente bien. Pero la realidad es que no existe un sistema que lo haga todo, desde la emisión de boletos hasta la administración y la generación de informes".
En QTS, Bentsen estuvo de acuerdo en que los clientes necesitan más que DCIM. “Creemos firmemente en DCIM; lo necesitamos para administrar nuestro edificio. Pero es una pequeña parte de nuestra plataforma. Nos encanta nuestro DCIM, pero sin nuestro lago de datos encima, usándolo de formas en las que DCIM nunca fue diseñado, nuestra plataforma de prestación de servicios no podría hacer lo que hace".
Bensten cree que la pandemia ha cambiado el comportamiento. "Creemos que nuestro conjunto de herramientas es mejor para el cliente, y la pandemia ha empujado a la gente a adoptarlo".
Pero, ¿qué pasa después del encierro? "Supongo que espero que las cosas no vuelvan a ser como eran", dijo Bensten. “He trabajado mucho para mi carrera en servicios administrados y uno de mis objetivos es la cloudificación del centro de datos. Quiero que el centro de datos funcione como funciona la nube.
“Dentro de unos meses, cuando esto termine, lo último que alguien va a hacer es subirse a un avión para visitar un centro de datos”.