Facebook ha culpado a su interrupción de seis horas el lunes a un cambio de configuración defectuoso que afectó a sus plataformas de redes sociales y sistemas internos.
Facebook, junto con WhatsApp e Instagram, sufrieron una interrupción global el lunes 4 de octubre que comenzó aproximadamente 17:40 hora española y se prolongó durante varias horas.
En una publicación de blog, el vicepresidente de infraestructura de Facebook, Santosh Janardhan, dijo que la interrupción había sido causada por un problema técnico que afectaba su sistema de enrutamiento Border Gateway Protocol (BGP), que tuvo "un efecto en cascada en la forma en que se comunican nuestros centros de datos".
La interrupción también afectó a las herramientas internas de Facebook, lo que dificultó el rápido diagnóstico y la solución del problema, dijo Janardhan. Según el New York Times, la interrupción inutilizó también las tarjetas de acceso de los ingenieros, lo que provocó que el personal no pudiera entrar a los edificios donde se encontraban los servidores afectados.
"Nuestros servicios ahora están nuevamente en línea y estamos trabajando activamente para que regresen por completo a las operaciones normales. Queremos dejar claro en este momento que creemos que la causa principal de esta interrupción fue un cambio de configuración defectuoso".
El BGP fue diseñado originalmente para interconectar proveedores de servicios de Internet en todo el mundo. Ahora forma la columna vertebral de enrutamiento de Internet.
Facebook también utiliza BGP como base para el diseño de enrutamiento de su centro de datos. En una publicación de blog de mayo de 2021, los investigadores de Facebook dijeron que el diseño de enrutamiento tenía como objetivo permitir que la empresa "construyera nuestra red rápidamente y brinde alta disponibilidad de nuestros servicios, mientras mantiene el diseño escalable".
Sin embargo, los investigadores también han señalado que el BGP "requiere un código estricto con la tipología del centro de datos, la configuración, el software de conmutación y la canalización operativa de todo el centro de datos". Irónicamente, la configuración de enrutamiento del centro de datos de Facebook se diseñó específicamente para minimizar el impacto de las fallas.
Facebook ha informado que ningún dato de los usuarios se ha visto comprometidos durante la interrupción.