La virtualización se ha convertido en una tecnología ubicua para nuestros tiempos. Las mejoras en los hipervisores han reducido la complejidad, mejorado la utilización del servidor y una mayor agilidad. Pero también hay un potencial inconveniente. Para transformar un servidor físico en muchas máquinas virtuales (VM), se agrega una capa de software adicional.

Si bien se simplifica la experiencia del usuario administrador, la virtualización aumenta la complejidad general del entorno de TI, lo que hace que sea más difícil para los administradores saber en qué sistema físico se ejecutan sus máquinas virtuales o qué almacenamiento se utiliza para una máquina en particular en caso de pérdida de datos. Con menos personas para mantener y monitorear una mayor cantidad de máquinas virtuales, hay más posibilidades de pérdida de datos que nunca.

Éstos incluyen:

Problemas de hardware / RAID

Para ayudar a prevenir la pérdida de datos, los sistemas modernos a menudo usan alguna forma de replicación de datos en múltiples unidades físicas (HDD o SSD) que se consolida en una sola unidad lógica. Esta protección de datos puede ser una solución basada en hardware o software. RAID combina múltiples discos duros o bandas de datos para mejorar la redundancia, aumentar la confiabilidad de los datos y aumentar el rendimiento de E / S (entrada / salida).

Desafortunadamente, la pérdida de datos no es infrecuente con el almacenamiento RAID. La complejidad de RAID se suma a la presencia de duplicación y compresión. Ahora incorpora una capa de virtualización adicional y aumentan las probabilidades de sufrir una falla. Si una configuración RAID se corrompe, la interconectividad de varios sistemas puede causar una pérdida de datos significativa y tiempo de inactividad.

Formateo / Problemas de software

Reformatear y reinstalar son causas adicionales de pérdida de datos en entornos de virtualización. La corrupción puede ocurrir debido a actualizaciones defectuosas, implementación mal planificada, problemas de integración o corrupción de la base de datos.

En lugar de asignar todos los datos que necesitará la VM y posicionar las estructuras del sistema de archivos en sus desplazamientos físicos especificados, el aprovisionamiento solo proporciona la cantidad de espacio que se necesita de inmediato y agrega bloques adicionales al disco virtual a medida que crece. Esto puede generar un entorno virtual más complejo y fragmentado. Si los punteros de metadatos a los datos faltan o están dañados, es difícil ubicar los diversos fragmentos y reconstruir el disco virtual.

Corrupción de metadatos del sistema de archivos virtual

Otra fuente de pérdida de datos es la corrupción de metadatos. Los metadatos son aún más importantes en entornos de virtualización debido a la cantidad de capas y máquinas virtuales que existen. Un pequeño problema con los metadatos de VMFS puede tener serias repercusiones en la disponibilidad de datos.

Error de usuario

Una cantidad sorprendentemente grande de fallas se debe a que los discos virtuales se eliminaron por error, se sobrescribieron las máquinas virtuales o se reasignó su espacio. También puede haber corrupción de la cadena de instantáneas, es decir, una de una serie de instantáneas está dañada, se elimina o deja de estar disponible por algún otro motivo. Esto puede dañar las copias de seguridad y dificultar la recuperación de datos.

¿Qué pueden hacer las empresas cuando experimentan pérdida de datos de un entorno de virtualización? No hay botón de retroceso o deshacer. Una máquina virtual eliminada se ha perdido para siempre. Afortunadamente, la recuperación de datos a menudo es posible a través de proveedores de servicios de recuperación de datos globales.

El primer punto de entrada está en el nivel de almacenamiento. En algunos casos, puede ser posible recuperar directamente datos de unidades físicas tomando una imagen de las unidades y leyendo los datos sin procesar que puedan estar disponibles en el disco.

La siguiente opción es intentar recuperar datos de los volúmenes lógicos (LUN) o RAID. Si el controlador RAID está disponible, se puede usar para rastrear los muchos segmentos de datos distribuidos en discos virtuales.

El siguiente nivel es el nivel del sistema de archivos del host. En VMware, esto sería VMFS y en Hyper-V, NTFS o ReFS. En muchos casos, los datos no están disponibles directamente en el nivel de almacenamiento. Pero si se utilizan las herramientas adecuadas, los expertos en recuperación pueden rastrear los datos de los bloques de datos de almacenamiento básicos, asignarlos al nivel de host y volver a compilarlos.

Si ese proceso no proporciona una recuperación adecuada, se pueden emplear herramientas adicionales para ampliar aún más el nivel del sistema de archivos invitado. Al investigar el sistema de archivos virtual, los especialistas en recuperación de datos a veces pueden encontrar datos que de otro modo se perderían. Finalmente, es posible acceder al nivel de archivo invitado y acceder a los datos que acechan en archivos de aplicaciones como SQL, Exchange, SharePoint, Oracle, archivos de Office, archivos ZIP y más.

Lo que se necesita es comprender cada nivel y saber qué podría estar disponible y dónde. Los expertos en arquitecturas de almacenamiento pueden rastrear datos que parecían perdidos al encontrar partes de ellos en un nivel y otras partes en otro nivel.

La virtualización puede ahorrar tiempo y eliminar la complejidad de la vista del usuario. Pero viene con un conjunto único de desafíos. Ya sea por corrupción de volumen, ransomware, copias de seguridad virtuales corruptas, fallos de hardware o archivos eliminados accidentalmente, la pérdida de datos es una realidad para cualquiera que administre sistemas virtuales. Si bien la copia de seguridad es necesaria para salvaguardar los datos de la empresa, está lejos de ser infalible, por lo que no se debe confiar demasiado en ella.


Por Phil Bridge, Presidenta de Ontrack