El tiempo de inactividad forzado es una amenaza común y, a menudo, costosa para las empresas, ya sea que una organización sea víctima de un ciberataque, un desastre natural o incluso un simple error humano. La planificación avanzada y el gasto por adelantado para mitigar posibles desastres salvarán a su empresa a largo plazo. La inversión temprana en soluciones de recuperación ante desastres (DR) permitirá la continuidad del negocio, evitará mucho estrés innecesario y salvará a cualquier organización de costos de recuperación potencialmente devastadores.

¿Qué es la recuperación ante desastres?

Una definición es que la recuperación ante desastres es un área de planificación de la seguridad que protegerá a una organización de los efectos de eventos negativos importantes. La recuperación ante desastres permite que una organización mantenga o reanude rápidamente las funciones de misión crítica después de cualquier tipo de desastre.

Esto significa que la implementación de la recuperación ante desastres requiere un enfoque diferente para cada organización, ya que cada una tiene sus propias funciones de misión crítica. Por lo general, algunas funciones de misión crítica se ejecutan o dependen de la infraestructura de TI. Por lo tanto, es bueno mirar la RD dentro del contexto de esta infraestructura; sin embargo, debe formar parte de la planificación de la continuidad del negocio en su conjunto.

Preguntas importantes que debe hacerse al planificar y diseñar una infraestructura de alojamiento de misión crítica:

  • ¿Cuánto tiempo pueden no estar disponibles las funciones de misión crítica (RTO)?
  • ¿Cuántos datos se pueden perder? Esto significa el período de tiempo durante el cual los datos no se pueden recuperar (RPO). Por ejemplo, si se realiza una copia de seguridad diaria de los datos, entonces un desastre solo puede causar un día de pérdida de datos.
  • ¿Cuánto dinero le costará a la organización (por hora) cuando los servicios de misión crítica no estén disponibles?

Las medidas de recuperación ante desastres incluyen prevención, detección y corrección.

Recuperación ante desastres para fallas comunes

La mayoría de los servicios de alojamiento incluyen recuperación ante desastres para las fallas más comunes, como fallas en un disco físico, servidor, conmutador de red, conexión de enlace ascendente de red o alimentación de energía. Esto se conoce como alta disponibilidad (HA).

Una configuración redundante resuelve fallas tales que, si falla un elemento, otra pieza de infraestructura se hace cargo. Los dispositivos y cableado de red redundantes, las múltiples fuentes de alimentación, la conmutación por error sin interrupciones a la energía de la batería y los generadores de energía separados que pueden funcionar para siempre juegan un papel importante para mantener la infraestructura de TI y, por lo tanto, sus servicios de software en funcionamiento. En caso de un incendio en un centro de datos, el fuego generalmente se detecta temprano y se extingue a través de gas, reduciendo el oxígeno, sin siquiera afectar a la mayoría de los equipos en la misma sala del centro de datos. Esto significa que la mayoría de los 'desastres' se recuperan sin afectar la disponibilidad de los servicios de infraestructura.

Una de las tácticas más utilizadas en la recuperación ante desastres es crear una copia de seguridad frecuente de sus datos. Estos aseguran que, si ocurre un desastre, pueda restaurar su copia de seguridad y reiniciar sus funciones de misión crítica y otros servicios.

Para un relanzamiento más rápido de sus servicios después de un desastre, la replicación de sus servidores de aplicaciones y datos puede resultar útil. Está disponible para reiniciarse, en comparación con las copias de seguridad que primero deberían restaurarse, lo que lleva más tiempo.

Prepararse para desastres críticos

Aunque es mucho menos probable que suceda, ninguna estrategia de recuperación ante desastres está completa si no tiene en cuenta los desastres más grandes. Para mitigar estos riesgos y permitir la continuidad del negocio, considere un entorno de infraestructura de TI alternativo. Muchas organizaciones buscan estas soluciones en la nube.

Algunos optan por hacer una copia de seguridad de los datos críticos en otra ubicación o en la nube. Otros replican servidores de aplicaciones y datos en otra ubicación, con infraestructura de alojamiento disponible, para poder relanzar los servicios de aplicaciones rápidamente o tener una conmutación por error sin interrupciones del servicio. La opción de servicios en la nube suele ser económica, en lugar de gastar en infraestructura.

En caso de que necesite mitigar el riesgo de falla de todo el entorno, la solución común es incluir un sitio de centro de datos de conmutación por error en el plan de configuración de la infraestructura de TI. La recuperación ante desastres mediante la adición de un centro de datos alternativo (también llamado configuración Twin DC) también requiere un enfoque personalizado para identificar la configuración correcta para sus aplicaciones y funciones de misión crítica. Esta opción también incluye la necesidad de un mayor presupuesto.

Esto significa encontrar un equilibrio entre invertir en una infraestructura de alojamiento más confiable, aplicaciones que se ocupen de las fallas en la infraestructura subyacente y planificar y preparar la conmutación por error a un entorno de infraestructura alternativo.

Principales conclusiones

Como cada negocio es diferente, cada uno debe tener su propio enfoque para la recuperación de desastres y la planificación de la continuidad del negocio. El desafío para cualquier organización es equilibrar las herramientas y los métodos disponibles. Sin embargo, el objetivo debe ser muy claro para todos: invertir por adelantado para evitar mayores costos de recuperación en caso de desastre.


Por Sarah Doherty, gerente de marketing de producto en Iland