¿Cómo preservamos la historia digital reciente?

Un informe del Pew Research Center señala que el 25% de las páginas web existentes entre 2013 y 2023 han desaparecido; algunas organizaciones, como Internet Archive, trabajan para cuidar la memoria online.

Pedro Fernaud

Periodista

Guardar

El 25% de las páginas web existentes entre 2013 y 2023 han desaparecido. Hay que cuidar la historia digital.
El 25% de las páginas web existentes entre 2013 y 2023 han desaparecido. Hay que cuidar la historia digital.

Internet es una red global que conecta millones de dispositivos y permite el intercambio instantáneo de información, comunicación y acceso a servicios en todo el mundo. Su uso ha revolucionado el acceso al conocimiento, facilitando la educación, la investigación y el intercambio cultural a escala mundial. Además, ha transformado la economía, el comercio y las relaciones sociales al ofrecer nuevas formas de interacción y colaboración.

Sin embargo, todo parece más fugaz y efímero en el ámbito de la red. Hoy día afrontamos los desafíos de preservar la historia digital en un mundo donde gran parte de nuestra vida está registrada en línea, lo que contrasta con el rico legado de documentos históricos que atesora el conjunto humano.

Hablamos de una nómina en la que despuntan los fragmentos de papiro de Pompeya o el Domesday Book de Inglaterra. También brilla con valor propio el Códice Maya de Dresde: testimonio de la cultura y astronomía maya. Eso por no hablar de algunos de los libros más valiosos vinculados con el desarrollo de la imprenta, como La Biblia de Gutenberg (siglo XV): primer libro impreso con tipos móviles; Don Quijote de la Mancha (1605): obra maestra de la literatura universal; La Divina Comedia (siglo XIV): poema épico de Dante Alighieri; o las obras completas de Shakespeare (1623): clave universal del teatro y poesía inglesa.

Volviendo a nuestra época: a pesar de los esfuerzos de organizaciones como el Internet Archive, que ha acumulado una vasta colección de contenido digital, el riesgo de que información crucial se pierda es alarmante. La falta de un esfuerzo centralizado y los problemas legales, financieros y técnicos que afrontan estas iniciativas ponen en riesgo la preservación del patrimonio digital, dejando en manos de voluntarios la tarea de archivar la historia contemporánea. Sin un apoyo institucional adecuado y una estrategia prioritaria, el legado digital de nuestra era podría desvanecerse.

Retos para preservar el legado de internet

2
Google ha anunciado que desactivará los enlaces creados con su acortador de URL a partir del próximo año.

La historia digital corre el riesgo de desaparecer debido a la obsolescencia tecnológica, la falta de esfuerzos institucionales y el rápido ritmo de renovación en internet. Tanto es así que, entre 2013 y 2023, una cuarta parte de las páginas web dejaron de existir, según el informe del Pew Research Center, un centro de investigación estadounidense que ofrece análisis y datos sobre tendencias sociales, demográficas, políticas y tecnológicas a escala global.

El estudio resalta desafíos significativos para preservar el legado de internet debido al fenómeno del “decaimiento digital”, donde el contenido en línea desaparece con el tiempo. Entre 2013 y 2023, un 38% de las páginas web de 2013 ya no son accesibles, y cerca del 23% de las páginas de noticias y gubernamentales contienen enlaces rotos.

La pérdida de contenido afecta especialmente a redes sociales y plataformas históricas. El informe destaca que en Twitter el 60% de los tuits desaparecidos corresponden a cuentas que se hicieron privadas, fueron suspendidas o eliminadas, y que este problema es más frecuente en publicaciones en árabe o turco, donde el 40% de los tuits desaparecen en apenas tres meses. Además, plataformas de referencia en el ámbito online como Geocities, MySpace y Blogger han perdido gran parte de sus contenidos, lo que contribuye a un creciente vacío en la memoria digital.

Este problema no solo compromete la continuidad del acceso a información histórica, sino también la confiabilidad de las fuentes en contextos académicos y periodísticos. Además, el estudio expone que las redes sociales amplifican esta efimeridad, con un 18% de los tuits desapareciendo en meses, sobre todo por cambios en las configuraciones de privacidad o eliminación de cuentas. La preservación de este contenido es crítica para mantener la transparencia, la educación y la memoria digital colectiva.

Para abordar estos retos, se pueden explorar soluciones como el uso de tecnologías de archivado web más robustas, como Common Crawl o el Internet Archive, para capturar y almacenar sistemáticamente contenido digital. Asimismo, se deben fomentar estándares en sitios web para mantener enlaces internos y externos actualizados.

Otra estrategia sería implementar políticas públicas que promuevan la conservación digital, lo que se traduciría en el estímulo a instituciones clave como Gobiernos y medios para respaldar su contenido en repositorios abiertos. En esa dirección, la colaboración con plataformas tecnológicas para aumentar la accesibilidad y la transparencia en sus datos podría mitigar la pérdida de contenido en redes sociales, garantizando así un legado digital más resiliente.

Internet Archive: memoria de 886.000 millones de webs

4
Corremos el riesgo de que la memoria digital sea cada vez más fugaz.

Este problema afecta tanto a páginas antiguas como recientes y compromete la evidencia en sitios como Wikipedia, donde más de la mitad de los enlaces en las referencias están rotos, son inservibles a día de hoy. Sin embargo, organizaciones como la ya citada Internet Archive, liderada por Brewster Kahle (ingeniero informático y activista de internet que aboga por el acceso universal al conocimiento y la biblioteca digital) trabajan para preservar esta memoria colectiva. Esto es posible gracias a proyectos como la Wayback Machine, que han recopilado más de 866.000 millones de páginas web, además de libros, películas y otros contenidos, posibilitando de esta manera que el acceso a muchos de estos recursos no se pierda para siempre.

¿Qué impulsa este formidable esfuerzo de preservación de la memoria colectiva? “Muchas de nuestras conversaciones, entretenimiento y esfuerzos intelectuales existen solo en un entorno digital. Ese entorno es inherentemente frágil”, señala Mark Graham, director de la herramienta Wayback Machine, cuya labor se traduce en capturas instantáneas de sitios web para el futuro.

A pesar de sus logros, el Internet Archive afronta desafíos legales, ciberataques y limitaciones financieras que amenazan su continuidad. En ese marco se incluye un fallo judicial en 2023 que limitó su digitalización de libros y un reciente ataque DDoS en mayo de 2024. Estos desafíos podrían comprometer su misión de salvaguardar la memoria digital. Según EcoNews, “si el Archivo falla, una parte significativa del mundo digital tal y como lo conocemos podría perderse para siempre”.

¿Qué otras instituciones u organizaciones funcionan en la misma dirección de Internet Archive? Iniciativas gubernamentales, como las de la Biblioteca del Congreso de EE.UU. o el Archivo Web del Reino Unido, contribuyen a la preservación, pero su alcance es limitado. El enfoque integral del Internet Archive lo convierte en un referente clave para salvaguardar la historia de internet. Además, sus archivos han sido esenciales para mantener registros accesibles y son citados habitualmente en investigaciones y publicaciones, lo que demuestra la importancia de proteger nuestra memoria digital en un mundo cada vez más fugaz.

El riesgo de que una sola entidad haga la preservación

A pesar de su relevancia, los esfuerzos de la Internet Archive son vulnerables y descoordinados, en parte debido a su carácter informal y la falta de apoyo institucional. Según Andrew Jackson, arquitecto técnico del Digital Preservation Coalition, la situación actual evidencia el riesgo de depender de una única organización.

Mientras tanto, casos como el ciberataque a los sistemas de la Biblioteca Británica en 2023 subrayan la precariedad de estos proyectos. Por su parte, Mar Hicks, historiadora de la tecnología en la Universidad de Virginia, advierte de que las prioridades descentralizadas en la preservación digital generan vacíos históricos: “Los documentos perdidos representan voces importantes que han sido borradas”.

La financiación limitada agrava los problemas de sostenibilidad de la Internet Archive. Además de la ya comentada reciente derrota judicial que ha experimentado ante editoriales de libros, se encuentra inmersa en otro litigio contra discográficas, que podría costar hasta 400 millones de dólares. Hicks enfatiza la importancia de cubrir la necesidad de apoyo financiero para garantizar la persistencia de estos archivos: “Si no se financian, se desmoronarán y el propósito de preservar el pasado digital se perderá”. La falta de responsabilidad gubernamental e industrial crea un vacío que solo un reducido grupo de voluntarios y organizaciones intenta llenar.

El 11% de recursos de RR.SS. se desvanecen tras un año

3
El 11% de los recursos vinculados en RR.SS. desaparecen un año después de ser publicados.

La desaparición acelerada de contenidos en línea está creando un vacío histórico que preocupa a los expertos. Según Tom Chatfield, el 11% de los recursos vinculados en redes sociales se pierden un año después de su publicación, mientras que solo el 20% son archivados. Investigadores como Hany SalahEldeen y Michael L. Nelson, de la Old Dominion University, han analizado eventos históricos recientes como la revolución egipcia y han constatado que esta tendencia se intensifica con el tiempo: después de dos años y medio de que esta tuviera lugar, el 27% de los recursos ya no estaban disponibles. Este fenómeno pone en riesgo el tejido de conexiones vivas que constituyen la experiencia cotidiana, algo que ni siquiera empresas que venden datos pueden preservar de manera integral.

La facilidad y fugacidad de las comunicaciones modernas, como los tuits, están generando un problema histórico complejo. Mientras que los textos del siglo XVIII permanecen en bibliotecas, muchos datos clave de las últimas décadas se pierden o quedan inaccesibles. Tanto es así que Chatfield llega a afirmar que "cuando los historiadores quieran investigar el siglo XXI en el año 2312 tendrán dificultades y dependerán de empresas privadas que controlan la historia social contemporánea". La solución parece difícil debido a los intereses privados, la privacidad de las historias personales y el deseo de renovación constante, lo que podría requerir una reimaginación del concepto mismo de historia.

Para comprender la complejidad del fenómeno, resulta de gran utilidad también el artículo Bienvenido a la Edad Oscura digital, de Adam Rogers para Business Insider, donde se alerta sobre la desaparición de una parte significativa de la memoria colectiva en internet, comparándola con la quema de la Biblioteca de Alejandría. La situación se ha agravado con el anuncio de Google de desactivar los enlaces creados con su acortador de URL a partir del próximo año, lo que inutilizará miles de millones de conexiones digitales. Rogers advierte: "En internet, si tu URL no funciona, es como si no existieras". La fragilidad de lo digital queda en evidencia con la pérdida masiva de contenido debido al cierre de servicios, redes sociales y productos tecnológicos, lo que convierte a internet en una "era sin historia".

En resumen: la preservación de nuestra historia digital no es solo una responsabilidad técnica, sino un compromiso cultural y social que requiere la colaboración de todos. Iniciativas como el Internet Archive, la Biblioteca del Congreso de EE. UU. y el Archivo Web del Reino Unido trabajan incansablemente para conservar fragmentos de nuestra memoria colectiva, pero afrontan limitaciones legales, financieras y técnicas que ponen en riesgo su labor.

Si no actuamos con urgencia, el vacío histórico causado por la pérdida de información en plataformas como redes sociales o sitios web será irreversible, comprometiendo nuestra capacidad de comprender el siglo XXI. Solo con mayor apoyo institucional, marcos legales sólidos y una concienciación global sobre el valor de este patrimonio digital, podremos evitar que el entorno digital se convierta en una “era sin historia”.