Enterrado en lo profundo de una montaña al borde de la civilización, se encuentra lo que puede terminar siendo el último mensaje de la humanidad.
Para llegar allí, viajamos sobre el permafrost y subimos por un pasaje empinado, pasando señales de advertencia de osos polares más adelante. Luego descendimos a las minas oscuras, nuestros faros iluminaron los cristales de hielo que caían perturbados por nuestra presencia, bañándonos en lluvias relucientes y efímeras.
No está claro cuánto tiempo viajamos por el pozo, el tiempo viaja de manera diferente bajo tierra. Aquí, en esta montaña de Svalbard, se mide en eones, no en horas.
Pasamos por la Bóveda Global de Semillas, una instalación de respaldo de las semillas del mundo en caso de desastre, y viajamos más hacia abajo. Por fin llegamos a una puerta que brilla en la oscuridad. En ella están grabadas las palabras "Arctic World Archive: Protecting World Memory".
Antes de hablar sobre lo que hay detrás de esa puerta, debemos comprender los dos grandes desafíos de datos que espera resolver. Se le unen docenas de nuevas empresas, investigadores e incluso una corporación de billones de dólares que compiten para descubrir el futuro de los datos.
Un desafío es filosófico, el de nuestra muerte y destrucción, y lo que dejamos atrás. El otro es más inmediato, el de las crecientes hordas de datos, que amenazan con desbordar nuestros sistemas actuales y nos dejan incapaces de conservar datos críticos de forma económica.
El comienzo del conocimiento registrado
La historia de los datos es antigua. Hace unos 73.000 años, en lo que ahora es Sudáfrica, un ser humano primitivo recogió un trozo de ocre y grabó un símbolo en un fragmento de piedra, en lo que es nuestra obra de arte humana más antigua registrada.
Tomó la mayor parte de la historia de nuestra especie llegar a las grabaciones escritas, con la tablilla de Kish en 3500-3200 aC, donde los humanos grabaron inscripciones pictográficas en piedra caliza. Incluso entonces, se necesitaron miles de años para avanzar a las tablillas de arcilla y aún más para llegar al papiro, el pergamino y, finalmente, al papel.
La mayor parte de lo que sucedió en el mundo no fue registrado. De lo que fue, la mayoría se ha perdido en guerras, incendios y por la decadencia institucional, para nunca recuperarse. Nuestra comprensión de nosotros mismos y de nuestro pasado se cuenta a través de lo poco que sobrevivió, brindando una visión turbia que es profundamente defectuosa y se basa en los registros sesgados de reyes y emperadores.
Ahora, las cosas son diferentes. Estamos inundados de datos, de individuos, corporaciones y las propias máquinas. Pero guardamos esos datos principalmente en discos duros y unidades de estado sólido, que duran solo décadas si se mantienen sin usar en condiciones ideales, y solo unos pocos años si se ejecutan activamente.
Otras plataformas de almacenamiento comunes son las cintas magnéticas y los discos ópticos, que vienen en múltiples formatos de densidad y vida útil variables, pero que a menudo se usan para almacenamiento 'frío' a más largo plazo.
Todos tienen sus usos y beneficios e inconvenientes individuales, pero el simple hecho es que si dejáramos de transferir datos a nuevos equipos, casi todos desaparecerían antes de que termine el siglo.
"Los únicos registros escritos de nuestro tiempo serían los grabados en ollas de acero inoxidable que dicen 'hecho en China' y probablemente los logotipos de la empresa en la cerámica", explicó el fundador de Memory of Mankind (MoM), Martin Kunze.
Kunze es uno de los pocos elegidos que esperan evitar una pérdida tan trágica para nuestro futuro. Para hacerlo, está mirando a nuestro pasado.
Una colección de recuerdos
"Estudié arte con un enfoque en tecnologías de silicato y cerámica", dijo. "La idea de utilizar la cerámica como soporte de datos no es nueva, tiene 5.000 años".
Al igual que el archivo en Svalbard y los Rollos del mar profundo del pasado, también ha recurrido al depósito de datos bajo tierra como método de almacenamiento a largo plazo.
A 2 km de profundidad, dentro de la mina de sal más antigua del mundo debajo de la montaña Plassen en Hallstatt, Austria, hileras de baldosas de cerámica cuidadosamente organizadas intentan brindar una instantánea de nuestro mundo.
Los mosaicos más inmediatamente perceptibles son legibles para el ojo humano, con palabras e imágenes impresas en ellos a una resolución de 300 ppp, similar a una impresora a color normal.
Menos emocionantes visualmente a distancia, pero quizás mucho más importantes, son las placas de microfilm de cerámica. Kunze recurrió a la deposición física de vapor, un método de deposición al vacío que produce películas delgadas y recubrimientos en sustratos como metales, y luego graba datos con láser a cinco líneas por milímetro. Esto da alrededor de 500 veces la densidad de las planchas originales, que se utilizarán para almacenar 1000 de los libros más importantes del mundo.
Esto, a su vez, provocó un proyecto financiado por el gobierno para construir un láser de femtosegundo, que podría escribir en materiales aún más delgados, como la vitrocerámica. "Es muy pronto, pero hemos demostrado que es posible escribir y leer 10 gigabytes por segundo" a una densidad mucho mayor, dijo.
En cuanto a su vida útil, debería "superar con creces la existencia de nuestro Sistema Solar, por lo que se podría decir que es eterna", dijo. La tecnología está siendo desarrollada por una empresa cofundada por Kunze, Cerabyte, actualmente todavía en modo secreto.
Cerabyte no espera producir la tecnología por su cuenta y recurrió a Sony, que tiene una fábrica de discos ópticos en Austria que está decayendo lentamente con la muerte del formato, para desarrollar potencialmente "un producto mínimo viable que pretendemos tener" en un año y medio", dijo.
Está lejos de ser el único que intenta reinventar el panorama del almacenamiento de datos. Mientras que Kunze recurrió al pasado en busca de inspiración, otros optaron por un enfoque que parece sacado de la ciencia ficción.
Sopa de datos
"Creo que se podría decir que estamos en el negocio de tratar de construir una biocomputadora", dijo Dave Turek, director de tecnología de Catalog. "Estamos manipulando el ADN con el propósito de almacenarlo y computarlo, y estamos logrando un progreso real".
Turek sabe todo acerca de las complejidades de la computación tradicional: la última vez que hablamos fue después del lanzamiento de la supercomputadora Summit, entonces la más poderosa del mundo, un proyecto que encabezó durante sus casi 23 años en IBM.
La computación Wetware es una nueva vía. "No soy biólogo molecular, así que aquí estamos en igualdad de condiciones", bromeó antes de lanzarse a una densa explicación sobre el ADN.
La construcción clásica de doble hélice de ADN está hecha de escaleras formadas por solo cuatro bases: adenina, guanina, citosina y timina. Con ese simple punto de partida, se encuentran todas las secuencias de bases que dictan todo lo que hace que cada ser vivo sea único. "Es la forma en que la biología codifica la información", dijo Turek.
Tenemos ADN de alrededor de 3.500 millones de bases de largo, que contiene todo lo que somos, lo que sugiere el potencial de almacenamiento que podría aprovecharse. No es una idea nueva: los primeros intentos se remontan a 1988, mientras que el genetista estadounidense George Church codificó un libro en ADN en 2012.
Esos enfoques tomaron cada una de las letras A, G, C y T, y les asignaron valores de bits, lo que potencialmente permitió una increíble densidad de almacenamiento de datos. "Inmediatamente, la gente comenzó a ver el ADN como el remedio al desbordamiento de información creado en la sociedad moderna", dijo Turek. "Y están completamente equivocados".
Catalog cree que esos investigadores, así como algunas empresas rivales de almacenamiento de ADN, han cometido un error crucial. "Entonces tienes que resolver un problema fundamental, que es que cada vez que agregas otra base a tu ADN sintético, toma 30 segundos. Entonces, si el costo es de 30 segundos por cada dos bits de información, no va a funcionar muy bien."
La empresa ha decidido reducir la escala y no trabajar a nivel de pares de bases, sino que ha construido un alfabeto compuesto por pequeños fragmentos de ADN. Catalog ahora tiene 100 de estos oligonucleótidos, como se les conoce, con los que puede crear datos conectándolos entre sí en lo que se llama ligación.
"Y la máquina que inventamos y desarrollamos automatiza ese proceso, lo cual es un gran problema", dijo Turek. "Utiliza cabezales de impresión de inyección de tinta que contienen estos oligonucleótidos. Y cada depósito es único entre los demás. De modo que cada una de las boquillas puede recibir instrucciones de disparar un fragmento particular de ADN fuera de mi alfabeto".
La máquina 'Shannon' tiene tres mil boquillas que depositan gotas de tinta de ADN al nivel de picolitros, 500.000 veces por segundo. Estos se mezclan para crear una larga cadena de datos que contienen ADN. “De la forma en que está configurado actualmente, puedo crear un billón de moléculas únicas en un día”, dijo.
Esto luego se puede leer con un secuenciador de ADN, y la compañía actualmente usa máquinas Oxford Nanopore. Estos son mucho más lentos que las máquinas de escritura: "si me lleva 10 minutos escribir un montón de datos, podría llevarme una semana hacer toda la decodificación".
Esto se debe a que la industria del genoma ha priorizado la precisión en el nivel básico sobre la velocidad, con una fidelidad que Catalog en realidad no necesita. "Tenemos que resolver el problema de la decodificación rápida en paralelo a la velocidad con la que podemos escribir", dijo.
"Tenemos algunas asociaciones establecidas para comenzar a tratar de hacer una innovación real también en el lado de la lectura. Hoy tenemos ideas que creemos que podrían generar fácilmente una mejora de dos órdenes de magnitud en la velocidad".
Incluso con la capacidad de almacenamiento ligeramente inferior de los oligonucleótidos, la cantidad que teóricamente puede registrar el ADN es alucinante. "Podrías poner toda la información del mundo en esto", dijo Turek, sosteniendo una lata de Pepsi. Tal hazaña aún está lejos, admitió, pero la compañía pudo almacenar toda Wikipedia en unas pocas gotas.
En cuanto a las capacidades de almacenamiento a largo plazo, la muerte de un mamut hace unos 1,2 millones de años da una idea de su longevidad. El año pasado, los investigadores secuenciaron con éxito el mamut Krestovka, previamente desconocido, y su cuerpo no se mantuvo exactamente en las condiciones ideales.
Quizás aún más atractiva es otra idea que se está cocinando en Catalog: usar ADN para computar. El concepto se encuentra en sus primeras etapas y solo funciona para tipos de cómputo muy específicos, pero aún sería un gran avance en la informática.
“Estamos haciendo un caso inspirado en un usuario potencial real”, dijo Turek. “Este no es un ejercicio académico teórico abstracto que se originó en un libro de texto. Y estamos utilizando a ese cliente para que nos guíe en términos de la naturaleza de los algoritmos y otros tipos de cosas que necesitan manifestarse en el ADN”.
Pasará mucho tiempo antes de que tales esfuerzos den sus frutos, pero Catalog tiene la esperanza de que la oportunidad sea enorme. “Si desea construir una computadora paralela, lo que hice durante 25 años, y desea agregar una unidad de computación incremental, generalmente tiene un costo bastante alto y consume mucha energía y espacio”, dijo Turek. .
En el ADN, argumenta, “puedo hacer que sea paralelo a bajo costo en un grado extraordinariamente grande. Si dice 'Quiero ejecutar esta instrucción 100 000 veces en paralelo', regresaría y le diría '¿100 000? ¿Por qué no 10 millones? ¿Por qué no 10 billones?'”
La idea es diferente. Estamos acostumbrados a pensar en el mundo de la computación en términos de electricidad y física, en bits y bytes. “Pero mire cómo la gente se está alejando de las arquitecturas de von Neumann y está comenzando a crear computadoras cuánticas”, respondió Turek.
“Creemos que estamos en el lugar correcto en el momento correcto, porque hay una aceptación de facto de arquitecturas alternativas en el mundo de la computación. Por extraño que creas que esto puede ser, los tipos en el mundo cuántico son más extraños, y aún pueden vender sus computadoras”.
No obstante, Catalog todavía tiene un largo camino por recorrer antes de que pueda convencer a las empresas de poner sus lagos de datos en sopas de datos y adoptar soluciones de almacenamiento no convencionales. Aquí, el rival Microsoft tiene una ventaja: puede implementar su concepto de almacenamiento a largo plazo en sus centros de datos y confiar en una sólida red de ventas para convencer a los usuarios de que su enfoque es el camino a seguir.
Salones de cristal
En Cambridge, los investigadores del hyperscalers han estado experimentando con sílice fundida, donde un láser de femtosegundo codifica datos en vidrio mediante la creación de capas de rejillas tridimensionales a nanoescala y deformaciones en varias profundidades y ángulos.
“Para leerlo, tomamos una imagen con un microscopio”, explicó el distinguido ingeniero y subdirector de laboratorio de Microsoft Research, el Dr. Ant Rowstron. “Tiene estas capas y te enfocas en una capa. Y luego tomamos varias imágenes al mismo tiempo. No le damos vueltas, leemos un sector completo a la vez”.
El Proyecto Silica fue creado por Rowstron y Microsoft después de darse cuenta de que el almacenamiento convencional estaba destinado a enfrentar un cuello de botella. “Comenzamos desde cero, preguntándonos cómo debería ser el almacenamiento”, recordó, y Microsoft decidió basarse en la investigación de almacenamiento de datos de sílice de la Universidad de Southampton.
Ha pasado por múltiples iteraciones en los últimos años, volviéndose poco a poco más denso y más fácil de leer y escribir. “Si tuviéramos que llenar nuestro plato de referencia de 12 centímetros por 12 centímetros por completo con datos, tendríamos alrededor de cinco terabytes”, dijo Rowstron.
La escritura sigue siendo lenta y costosa, y requiere láseres de alta potencia para grabar con precisión el vidrio en la parte correcta. A los críticos, incluidos algunos que trabajan en los otros proyectos de este artículo, les preocupa que existan límites fundamentales en la rapidez con la que se puede inyectar energía en el vaso sin causar problemas.
“Ha sido mucho trabajo”, admitió Rowstron. “Cuando vimos la tecnología por primera vez en Southampton, se necesitaban cientos de pulsos para escribir datos en el vidrio. Pero hemos estado trabajando en cómo formar estas estructuras con una cantidad muy, muy pequeña de pulsos”.
Se negó a revelar exactamente hasta dónde había llegado el proyecto, pero agregó: “si lo comparas con el estado del arte, estábamos significativamente por debajo de [ese número de pulsos]. Puede pensar en dólares por megabyte escrito, y yo diría que la tecnología ahora está en un buen lugar”.
Microsoft también está pensando en cómo se leería en un centro de datos. “Hemos recurrido a la robótica estilo almacén”, dijo Rowstron. "Y tenemos estos pequeños robots que funcionan de forma independiente, pueden moverse hacia arriba y hacia abajo y a lo largo de la estructura en este movimiento de cangrejo, lo cual es genial".
En un extremo, habría una máquina que escribe los datos en los bloques de vidrio, en el otro, un lector listo para descubrir qué hay dentro de cada bloque. Aparte de los robots y el escritor, no necesitaría energía ni refrigeración.
Eso significa que los primeros centros de datos que Silica inhibirá tendrán un exceso de ingeniería masivo. “Supongo que algún día terminaremos con edificios o centros de datos dedicados solo a almacenar ese vidrio preservado”, dijo Rowstron.
Ese vidrio puede durar alrededor de 10.000 años. “Nadie nos ha pedido que vayamos más allá”, dijo Rowstron. “Hay cosas que podrías intercambiar: podrías cambiar la densidad por la vida útil y cosas así. Pero debe recordar que nuestro objetivo es obtener una tecnología que nos permita usar esto en nuestros centros de datos. Ningún centro de datos va a existir durante 10.000 años”.
Otros podrían ir más lejos, si hubiera demanda. El trabajo original de Southampton descubrió que su sílice, mucho más lenta de escribir, podría durar 13.800 millones de años a temperaturas de hasta 190°C (375°F). Los investigadores almacenaron allí la Declaración Universal de los Derechos Humanos, la Óptica de Newton, la Carta Magna y la Biblia King James en pequeños discos.
“Mi esperanza es que dentro de 200 años haya una nueva tecnología de almacenamiento que sea incluso más eficiente, incluso más densa, incluso más duradera, y la gente dirá 'ya no necesitamos usar vidrio'”, dijo Rowstron. “Pero moverán los formatos porque quieren, no porque tengan que hacerlo”.
Rowstron cree que Silica resultará útil para los dos principales desafíos del almacenamiento de datos. “Quieres asegurarte de que pase lo que pase, los datos del mundo no se pierdan”, dijo. Pero la tecnología se enfoca naturalmente en las preocupaciones más urgentes a las que se enfrentan las empresas.
"Los discos duros languidecen, hemos tenido muy pocos aumentos de capacidad en los últimos cinco años; la cinta está sufriendo", dijo. "Cada vez se producen más datos, y tratar de almacenarlos de manera sostenible es un desafío para la humanidad".
El almacenamiento en frío que no requiere energía constante sería un gran impulso para el medio ambiente, al igual que alejarse de los metales de tierras raras como los que se encuentran en los discos duros (de los cuales puede que no haya suficiente para satisfacer la demanda futura). También es mucho más barato a largo plazo, cuando todo lo que tiene que preocuparse es dónde colocar el vidrio.
La tecnología llamó la atención de Guy Holmes, CEO de Tape Ark, una empresa australiana enfocada en mover bibliotecas de cintas obsoletas a la nube. "De hecho, lo tengo aquí en mi oficina", dijo, agarrando lo que al principio parecía un cuadrado de vidrio transparente, pero reveló filas de grabados microscópicos cuando se encendió una luz.
"Es muy pronto, pero parece tener patas internamente allí, y parece estar aumentando su densidad", dijo. "Pasé mucho tiempo con los muchachos del programa simplemente hablando sobre la densidad, los tiempos de acceso, la frecuencia de acceso, etc. Los clientes tienden a hacer una restauración por semana en este momento en función de las copias de seguridad. A medida que las cintas envejecen, la cantidad de acceso las solicitudes se reducen significativamente.
“Estamos descubriendo que existen estos archivos de retención infinita o cintas a las que nunca se ha accedido desde que se crearon”.
Su compañía sigue entusiasmada con la tecnología, pero actualmente está enfocada en el desafío más inmediato de simplemente sacar los datos de los sistemas de cinta anticuados y llevarlos a la nube, incluido Microsoft Azure. Allí, incluso podría volver a grabarse, pero primero Holmes recomienda intentar ver si hay algún valor oculto en los datos.
"La cantidad de personas que ni siquiera saben lo que hay en sus cintas es bastante sorprendente", dijo. "Podría haber una cura para una enfermedad, pero nadie lo sabe. Así que estamos entusiasmados con algunos de los proyectos que hacemos".
Otros esfuerzos tienen un valor claro inmediato. "Trabajamos con Steven Spielberg en seis petabytes de videos de sobrevivientes del Holocausto, que necesitaban preservación a largo plazo, necesitaban inmutabilidad para que nadie pudiera ir y hacer falsificaciones profundas en un video del Holocausto y decir que no ocurrió", dijo. El trabajo requería sacar datos críticos tanto de la cinta como de la película, en un esfuerzo por darles una vida más larga.
Con el cine, volvemos a la puerta de Svalbard. La empresa detrás del proyecto tiene sus raíces en la industria del cine, vendiendo proyectores de películas y tecnologías de modulación de luz digital a Hollywood y Bollywood.
“Y luego salió la película Avatar , y hubo una transición súper rápida de un mundo basado en películas a un mundo basado en proyectores digitales”, dijo el CEO de Piql, Rune Bjerkestrand.
El regreso del cine
Si bien la película parecía estar a punto de desaparecer, la compañía estaba convencida de que todavía había algo en el medio. Piql estudió diferentes tipos de películas de todo el mundo, con la esperanza de encontrar una que durara mucho tiempo y almacenara una gran cantidad de datos. Algunos duran hasta 500 años, pero no tienen mucha densidad y son peligrosamente inflamables.
“Así que nos embarcamos en el desarrollo de nuestra propia película, Piql Film, que es una película de nanohaluro de plata sobre una base de poliéster”, dijo Bjerkestrand.
La empresa toma código binario y lo convierte en píxeles grises, para una capacidad total de 120 GB por rollo de película. En buenas condiciones, esa película puede durar alrededor de 1.000 años, afirma Piql.
La empresa ha dividido su archivo de datos en dos. Uno es más tradicional, donde trabaja con empresas como Yotta en India para convertir datos en películas y almacenarlos en centros de datos comerciales de todo el mundo, con Piql destacando su uso contra ransomware o desastres de centros de datos.
Luego está el Arctic World Archive, presentado como una misión más humanitaria para preservar datos cruciales para las generaciones futuras.
Debido a su distancia de otras masas de tierra, el hecho de que ha sido declarado desmilitarizado por 42 naciones y su falta de recursos valiosos, la esperanza es que es poco probable que Svalbard sea bombardeado en conflictos futuros. Sin embargo, al igual que en cualquier otro lugar del planeta, el archipiélago noruego no puede presumir de seguridad total: es uno de los lugares del mundo que se calienta más rápido debido al cambio climático, y el territorio se ha enfrentado a una mayor agresión de Rusia.
Aún así, la tierra es remota y sus minas vacías son de poca utilidad para los posibles invasores. En la ceremonia de depósito a la que asistimos, se almacenaron obras de arte de archivos nacionales de todo el mundo (e imágenes de la boda de una pareja india, que pagó para que “su amor fuera registrado durante la eternidad”). Los carretes grandes de película se sellan cuidadosamente al vacío y luego se colocan en el contenedor de envío a 300 m bajo tierra, ubicado en lo profundo del permafrost.
Cualquiera puede pagar para almacenar sus datos en el archivo, pero principalmente encuentra negocios con gobiernos y organismos públicos. La plataforma de colaboración de software de Microsoft, GitHub, también almacenó 6000 repositorios de software en el sitio (también se almacena una copia de seguridad en la biblioteca Bodleian; consulte el archivo de datos al final).
“Es para personas que quieren llevar su información valiosa e irremplazable al futuro”, dijo Bjerkestrand, pero agregó que la compañía no planeaba ser un curador en sí mismo. “Esa ha sido una discusión seria, y llegamos a la conclusión de que no, ¿por qué deberíamos tener una opinión sobre lo que vale la pena llevar al futuro?”
Cuando se le preguntó cómo la AWA durará 1.000 años o más cuando esté vinculada a una corporación, Bjerkestrand dijo que la compañía planeaba escindirla como una fundación sin ánimo de lucro.
Actualmente, sin embargo, las personas pagan por el almacenamiento hasta por 100 años, después de lo cual los datos se les devuelven si no siguen pagando. En caso de que colapsara la institución que primero contrató a Piql, eso podría causar problemas: "Necesitan asegurarse de que alguien obtenga el derecho al carrete", dijo.
Una fundación, por otro lado, tendría un enfoque a más largo plazo. “Tal fundación tendría interés en todo el mundo para que las organizaciones la apoyen, básicamente está apoyando la memoria mundial para sobrevivir en el futuro”, dijo Bjerkestrand. “Así que creo que es una buena causa para la que podrías conseguir patrocinadores, donantes y simpatizantes”.
Al pensar en la escala de esa manera, no puede asumir que las generaciones futuras podrán comprender cómo funcionan los formatos de almacenamiento de datos. Aquí, Piql tiene una ventaja: como es una película, simplemente puede sostenerla contra la luz, y los primeros cuadros son imágenes de cómo acceder a la información.
Esos datos deben poder leerse con lo que está disponible en el rollo. “Tenemos un principio fundamental de que debe ser autónomo”, dijo Bjerkestrand. “No comprometemos que debe ser una licencia de código abierto y libre para recuperar los datos con las herramientas que están en los datos. Teníamos escenarios en los que podíamos obtener más datos sobre la película, pero entonces sería demasiado complejo de leer”.
Simplemente registrar la realidad y ponerla en uno de los medios anteriores no funciona si las civilizaciones futuras no pueden entenderlo, lo que representa un desafío crítico para gran parte de los datos de nuestros días.
La muerte de las herramientas
“Mi mayor preocupación es la pérdida de conocimiento del software que se necesita para interpretar rápidamente el contenido digitalizado”, dijo Vint Cerf, cocreador de TCP/IP.
“Una cantidad cada vez mayor de contenido digital que creamos fue creado por software, que es necesario para comprender, representar e interactuar correctamente con los datos, como con hojas de cálculo y videojuegos, donde realmente se necesita una pieza de software, además de un montón de datos en orden de ejercerlo. Si ya no tiene ese software ejecutándose en las plataformas que estarán disponibles dentro de 100 años, entonces no podrá hacerlo”.
Cerf, conocido como uno de los padres de Internet, le dijo a DCD que estaba "preocupado por los tipos de software que se necesitan para interactuar con las bases de datos, por ejemplo, hojas de tiempo y otros tipos de objetos complejos, donde es posible que no tengamos implementaciones tan generalizadas".
El miembro del Salón de la Fama de Internet, Brewster Kahle, comparte la preocupación sobre piezas específicas de software y datos que son propiedad o están en manos de corporaciones.
“Si miras la historia de las bibliotecas, son destruidas o estranguladas de tal manera que quedan irrelevantes”, dijo. “Y eso solía ser por reyes e iglesias, pero en estos días son gobiernos y corporaciones. ”
Como uno de los desarrolladores del precursor de la World Wide Web, el sistema WAIS, Kahle se encontró en un punto de inflexión de la humanidad, donde los datos estaban configurados para ser compartidos y accesibles para el mundo, pero eran transitorios y se perdían fácilmente. Esto, esperaba, brindaba la oportunidad de crear un nuevo tipo de biblioteca.
"Como estamos llegando a un cambio en el tipo de medios, ¿podemos ir y comenzar una biblioteca, de inmediato?" se preguntó, lanzando Internet Archive, una organización sin ánimo de lucro, que intenta crear una copia a largo plazo de sitios web, música, películas, libros y más.
"El objetivo de Internet Archive es tratar de construir la Biblioteca de Alejandría para la era digital", dijo. Y, hasta ahora, el esfuerzo ha tenido un gran éxito: "Somos una organización pequeña, tenemos entre 20 y 25 millones de dólares al año en costos operativos y, sin embargo, somos el sitio web número 300 más popular del mundo".
Pero su éxito continuo se ve amenazado por un mundo cambiante.
“Solo pude iniciar Internet Archive después de que Internet y la World Wide Web funcionaran realmente, ambos son sistemas abiertos. Entonces, si entramos en un período en el que la idea de la educación pública o el acceso universal a todo el conocimiento comienza a eclipsarse, estamos en problemas”, dijo Kahle.
“Vemos eso ahora dentro de los entornos corporativos, y estamos empezando a verlo en entornos gubernamentales, ya sea prohibiendo libros o donde puedes presionar a las organizaciones para que hagan cosas sin pasar por el estado de derecho, pero sí por el estado de contrato.”
Capas de control
A medida que la web se vuelve más centralizada y está en manos de unos pocos proveedores de la nube, sus términos de servicio corren el riesgo de controlar qué información dura lo suficiente como para almacenarse durante escalas de tiempo mayores. Al mismo tiempo, a medida que los sistemas se construyen sobre proveedores de la nube o plataformas como Facebook, almacenarlos también requeriría registrar todo el software de back-end que no se comparte.
Kahle está menos preocupado por la longevidad de los dispositivos de almacenamiento de datos y más por garantizar el acceso inmediato en un mundo abierto.
“Hace 100 años, el microfilme era una tecnología nueva, y fue recibido con fanfarria de que podríamos ponerlo a disposición para que las personas en áreas rurales pudieran tener acceso a la información al igual que las personas en las grandes universidades”, dijo. “Bueno, eso en realidad no sucedió, terminó siendo utilizado para reforzar las estructuras de poder y los editores que existían en ese momento”.
La cuestión de la memoria del mundo es menos sobre el medio en el que se almacena y más sobre cómo se usa cuando está en ese medio, argumentó. “El microfilm puede durar 500 años… si no lo tira. Pero resulta que la gente simplemente lo tirará incluso si no se ha copiado.
“No solo necesitamos formatos que duren mucho tiempo, necesitamos mantener el material en conversación, en uso para que a la gente le siga encantando y siga funcionando”.