La automatización de pruebas de red es uno de los temas candentes en la industria de las telecomunicaciones, y las redes de centros de datos no son una excepción.

La prueba de red automatizada adquiere aún más importancia en situaciones excepcionales, como lo que todos estamos experimentando en todo el mundo, ya que los equipos de mantenimiento y operaciones de red pueden verse obligados a trabajar de forma remota.

La tormenta perfecta

Si bien la industria en general es muy consciente de que el tráfico de red continúa expandiéndose exponencialmente, nadie esperaba (o al menos lo planeó) la situación causada por la pandemia de Covid-19.

Los desafíos pueden marearlo: la capacidad de la red alcanza sus límites, las cadenas de suministro que luchan con la producción / demanda y los equipos responsables de la recuperación y el mantenimiento de la red que trabajan desde casa utilizando servicios en red. Es la tormenta perfecta para afectar el rendimiento de la red en caso de una interrupción. El contenido como Netflix, los juegos interactivos como Fortnite, los servicios de comunicaciones como Skype o Zoom, y el acceso masivo de Enterprise VPN ha aumentado el tráfico de red global en un 30 por ciento de media. Esto pone a las redes de proveedores de servicios y centros de datos bajo presión y con muy poco margen de error.

Los centros de datos están listos para la recuperación ante desastres en muchos aspectos, como la alimentación, la refrigeración e incluso la conectividad de red. Y esto es generalmente cierto en el papel. En el mundo real, incluso con mecanismos redundantes, las interrupciones pueden causar un grave impacto comercial en los proveedores y sus clientes. Si observamos las interconexiones del centro de datos (DCI), esperar a que ocurra un problema ya no es una opción.

En caso de degradación del servicio en un enlace de fibra DCI, los sistemas de administración de red cambiarán automáticamente a otra ruta para transportar ese tráfico de manera segura; sin embargo, puede que no sea el más rápido y, en el caso del equilibrio de carga, puede impulsar el resto enlace a sus límites en cuanto a rendimiento).

Por lo tanto, el rendimiento de latencia juega un papel importante aquí. Seamos realistas, a nadie le gusta cambiar la ruta, y debería ser un último recurso en lo que respecta a la disponibilidad del servicio. Entonces, ¿cómo prever este tipo de situaciones? En caso de que alguna sección de la fibra esté dañada, o simplemente de bajo rendimiento, puede ser necesario enviar técnicos a una ubicación específica o DC.

Durante estos días de confinamiento, se considera una suerte que haya personal disponible, y puede llevar tiempo organizar los rollos de camiones y solucionar ciertos problemas: esto es lo que entendemos como MTTR (tiempo medio de reparación) y minimizar el impacto de esta respuesta el tiempo maximiza los ingresos de las organizaciones.

La importancia de la automatización de pruebas y la previsibilidad

Los centros de datos saben que para reducir el MTTR y crear visibilidad en la red, necesitan integrar y automatizar las funciones de prueba de red tanto como puedan. Reaccionar ante eventos de la red es demasiado arriesgado ya que se desconoce el impacto en el negocio, por lo que la mejor estrategia es invertir en la prevención de fallas de la red para aumentar la visibilidad y el control utilizando funciones de prueba automatizadas.

El costo de una interrupción es alto (promedio de 9.000 dólares por minuto, según el Instituto Ponemon). El objetivo es lograr el 100% del tiempo de actividad de la red, por lo que invertir en la visibilidad de la red no es una opción, es una necesidad.

Si analizamos los problemas de red típicos que vemos hoy, todavía se encuentra un gran porcentaje de problemas en la capa física. Estos problemas a menudo se deben a factores externos y fuera de nuestro control. La creación de funciones de prueba automatizadas para probar de forma proactiva las interconexiones de fibra ayudará a evitar la degradación del rendimiento y, en última instancia, las interrupciones. Además, es fundamental tener la capacidad de monitorear la red en vivo sin afectar el tráfico; en otras palabras, las pruebas "en servicio".

Pero la historia no termina aquí. Los ingenieros pueden usar estas funciones para construir mecanismos de aprendizaje automático para tomar decisiones basadas en los datos de la red (potencia óptica, degradación del enlace, latencia, etc.) de una manera que no es posible adoptando un enfoque de prueba reactiva en la red. Del mismo modo, los algoritmos de inteligencia artificial requieren datos, y los datos del estado de la red no se pueden excluir de la ecuación. En resumen, la previsibilidad será un pilar esencial en las redes de nueva generación en el futuro.

¿Y cómo afectará esto a los equipos de ingeniería de redes? ¿Van a desaparecer? Definitivamente no. La intervención humana siempre será necesaria, pero de una manera más productiva. Como se mencionó anteriormente, los ingenieros no pueden darse el lujo de esperar hasta que ocurra un problema de red, y su valor no está en pasar horas probando la red al azar, sino en construir una red más inteligente capaz de tomar decisiones inteligentes para garantizar un rendimiento óptimo.

Los centros de datos de hoy trabajan en su mayoría con sistemas abiertos, hardware y software abiertos, que les facilitan la vida en lo que respecta a los obstáculos de la interoperabilidad entre los proveedores, así como la escalabilidad de sus redes de rápido crecimiento. Los ingenieros necesitan pasar tiempo no solo optimizando los parámetros de red, sino también construyendo la automatización de pruebas. Las funciones de prueba de red deben ser definitivamente parte de esta estrategia para integrar la visibilidad y la inteligencia de la red.

Conclusión

Los operadores de centros de datos continuarán exigiendo una gran cantidad de capacidad de red para apoyar a sus clientes. Esto agregará más complejidad a los equipos de mantenimiento. Finalmente, la automatización de pruebas de red debe ser parte de sus planes de expansión de red para aprovechar mejor los recursos humanos y tecnológicos. Ya no podemos darnos el lujo de adoptar un enfoque de prueba reactiva en la red, por lo que los ingenieros deberán implementar rutinas de prueba en sus planes de expansión de red que impulsen la automatización y mejoren la previsibilidad de fallas.


Por David Zambrano, Gerente de Cuentas Globales del Centro de Datos EMEA en Viavi Solutions