Proteger y mover datos y cargas de trabajo de IA

La Inteligencia Artificial (IA) tiene el potencial de influir y transformar industrias enteras y potencialmente todos los aspectos de nuestras vidas.

La tecnología tiene una amplia gama de posibles aplicaciones en diversas industrias y dominios. Diariamente se hacen públicas nuevas aplicaciones y proyectos, y el uso de la nueva tecnología parece tener sólo un límite: las limitaciones de la creatividad humana.

Una cosa es segura: las cargas de trabajo de IA estarán entre las más críticas que utilizamos en la atención médica, las finanzas, el estilo de vida y muchas otras áreas. Sin embargo, esto plantea a las organizaciones la pregunta de cómo estas importantes aplicaciones de IA pueden mantenerse en funcionamiento sin tiempo de inactividad, y cómo los datos subyacentes pueden mantenerse seguros sin inhibir su movilidad.

Mantener los datos y las cargas de trabajo de IA siempre disponibles

Para garantizar la seguridad contra fallos y la protección contra pérdidas e interrupciones de datos, muchas organizaciones confían en la copia de seguridad probada y comprobada. Esto tiene sentido para la protección de datos a gran escala. Sin embargo, las copias de seguridad no son adecuadas para la continuidad del negocio y la recuperación ante desastres, especialmente para los datos y cargas de trabajo más críticos, como las cargas de trabajo críticas de IA.

Las copias de seguridad tienen la debilidad de que sólo protegen servidores individuales, pero no aplicaciones completas. Después de restaurar los datos desde una copia de seguridad, las aplicaciones primero deben volver a ensamblarse manualmente a partir de sus componentes individuales. Esto cuesta tiempo y es responsable de tiempos de restauración que pueden durar días o incluso semanas.

Para garantizar la disponibilidad constante de aplicaciones críticas de IA, las empresas necesitan soluciones más modernas que puedan garantizar una rápida recuperabilidad. Cada vez más empresas recurren a soluciones de recuperación ante desastres para una recuperación más rápida de sus datos y cargas de trabajo más críticos.

Actualmente, CDP (Protección continua de datos) es la solución de recuperación más eficaz. Con CDP, todos los cambios de datos se registran en un diario a medida que se escriben. De este modo, CDP permite volver al estado que existía sólo unos segundos antes de un ataque u otra interrupción en cuestión de segundos y sin una pérdida significativa de datos.

Las aplicaciones críticas de IA necesitan los RPO y RTO más bajos posibles

Para lograr los RPO y RTO más bajos posibles para aquellas aplicaciones críticas de IA, la replicación casi síncrona ofrece lo mejor de ambos mundos: el alto rendimiento de la replicación síncrona sin los altos requisitos de red o infraestructura.

La replicación casi sincrónica es técnicamente una replicación asincrónica, pero es similar a la replicación sincrónica, ya que los datos se escriben en varias ubicaciones al mismo tiempo, pero permite un pequeño retraso entre las ubicaciones primaria y secundaria.

La replicación casi sincrónica está siempre activa y replica constantemente solo los datos modificados en el sitio de recuperación en cuestión de segundos. Como siempre está activado, no es necesario programarlo, no utiliza instantáneas, escribe en el almacenamiento de origen y no tiene que esperar la confirmación del almacenamiento de destino.

Una de las principales ventajas de la replicación casi síncrona es que proporciona un alto nivel de disponibilidad y protección de datos, al mismo tiempo que permite velocidades de escritura más rápidas que la replicación síncrona. Esto lo convierte en una buena opción para cargas de trabajo como aplicaciones críticas de IA con altas cargas de escritura y/o grandes cantidades de datos.

La movilidad de datos para datos de IA crea enormes desafíos para la infraestructura de TI

La IA se basa en datos. La escala de los datos de la IA es nada menos que una era completamente nueva de creación de datos y la escala y el volumen son exponencialmente mayores que cualquier cosa que TI haya visto antes. Incluso las aplicaciones simples utilizarán exabytes de datos sin procesar que deben prepararse para el entrenamiento del modelo y la posterior inferencia.

Los conjuntos de datos a menudo se crean en el borde y deben transferirse para su procesamiento a un depósito de datos central. Y al final del ciclo de vida de los datos de IA, es necesario archivarlos para una posible reentrenamiento.

Todo esto crea desafíos completamente nuevos para la infraestructura y la gestión de TI, ya que estas enormes cantidades de datos deben poder moverse continuamente.

Levantar y transferir estos enormes conjuntos de datos no será posible con la tecnología de red actual y las soluciones de gestión de datos basadas en replicación sincrónica.

Para poder seguir moviendo datos de IA con potencia de procesamiento y ancho de banda limitados, será necesario utilizar la replicación asíncrona. Esto garantiza una replicación continua con un ancho de banda bajo a nivel de bloque que no produce picos elevados de transferencias de datos.

Conclusión: el futuro de la IA necesita CDP y replicación casi sincrónica

La IA puede crear una pista de música house en segundos y pintar un cuadro tuyo al estilo Van Gogh. Pero muchas aplicaciones de IA actuales y futuras también tienen el potencial de mejorar a la humanidad en general.

Muy pronto la IA podrá ayudarnos a diagnosticar enfermedades, detectar células cancerosas, conducir vehículos de forma autónoma, solucionar la congestión del tráfico, traducir varios idiomas, optimizar el consumo de energía, detectar enfermedades de los cultivos o controlar el clima y la calidad del aire y el agua, entre muchos otros casos de uso sorprendentes.

Estas aplicaciones serán críticas para los humanos y deben protegerse con las mejores soluciones disponibles, como la protección continua de datos. Al mismo tiempo, la escala de la IA crea enormes desafíos para la infraestructura de TI actual a la hora de guardar, gestionar y mover enormes cantidades de datos.

Las tecnologías actuales no podrán proporcionar la movilidad de datos necesaria para la escala masiva de conjuntos de datos de IA. Para poder gestionar los datos de IA con éxito, será necesario adoptar nuevas soluciones de movilidad de datos.