El costo mínimo por minuto de una interrupción no planificada es aproximadamente de $926, siendo el costo promedio de $7003 el minuto, y el costo máximo promedio de hasta $17244 por minuto, según el estudio más reciente “Cost of Data Center Outages” realizado por Ponemon Institute y publicado en enero de 2016.

Estos costos están basados en los ocho procesos o actividades que conducen a un rango de gastos en el que incurre la organización para responder a la interrupción del centro de datos, incluyendo el costo de recuperación, productividad, costo de oportunidad de negocios, daño de imagen o prestigio, pago de proveedores o consultores, entre otros.

 

Las buenas prácticas de operación y gestión contribuyen significativamente a minimizar los impactos

El fallo del sistema de UPS, ataque cibernético, error humano, y fallo en sistema de enfriamiento (agua helada, unidades CRAC) son las cuatro causas más importantes de las interrupciones no planificadas de un centro de datos, según indica el estudio.

Desde el 2013 hasta el 2016 el porcentaje de interrupciones no planificadas por causa de error humano es el mismo, es decir no ha habido progreso significativo en la implementación de medidas que reduzcan el error humano en las operaciones del día a día del centro de datos.

De acuerdo con nuestra experiencia, podemos afirmar que las 4 principales causas de interrupciones no planificadas también son directamente atribuibles a la ineficacia o escasez de la implementación de buenas prácticas de operación y gestión de mantenimiento en los centros de datos.

La implementación apropiada de protocolos de gestión y mantenimiento no solo asegura la disminución significativa de la probabilidad de fallo de los equipos electromecánicos, sino que predice estos fallos basados en la condición del equipo y en su desempeño con el entorno de la infraestructura. Así mismo, prepara a la organización a responder de manera natural a las emergencias o fallos de los equipos, y de la misma manera entrena a los operadores el cómo actuar ante situaciones no esperadas (múltiples fallos o riesgos detonados simultáneamente).

Una analogía que puede ilustrar lo anterior es el caso de una persona diabética que no ha sido diagnosticada profesionalmente y por lo tanto no tiene los controles, los cuidados cotidianos, el tratamiento adecuado ni el monitoreo constante de su condición. Esta persona al ignorar su padecimiento y desconocer los síntomas que anuncian su enfermedad o inclusive podría estar conviviendo con su enfermedad de manera asintomática o silenciosa, eventualmente presentará un colapso repentino en su salud con consecuencias graves que comprometen su calidad de vida.  Así mismo, la ausencia de procedimientos que permitan la detección temprana de la condición y salud de los equipos electromecánicos conlleva a interrupciones inesperadas como son los fallos comunes en sistemas de UPS, la apropiada implementación de buenas prácticas de operación y gestión le permitirá evitar estos fallos de manera anticipada optimizando así el costo de operación y aumentando la confiabilidad de su centro de datos.

 

Por Ing. Lorraine López

Intelligence Carbon Zero

Logo ICZ más pequeño 


Pueden encontrar más información en su conferencia en el DC SummitPanamá, 12 de abril, Panamá Marriott Hotel.

DC Summit