Preservación: la construcción de la continuidad digital

Las iniciativas de acceso abierto a la publicación online, cuyo impulso y volumen se ha convertido en una fuerza arrolladora en los últimos años, hace cada vez más importante considerar el problema de la preservación a largo plazo de los contenidos.

Una de las primeras señales que advirtieron el desafío y el problema de la preservación digital fue lanzada en 1996 en un informe preparado por el Research Libraries Group, un consorcio de bibliotecas basado en los Estados Unidos, quienes en 2006 se unieron a la OCLC integrando el WorldCat. Estos primeros informes y análisis de los problemas sobre preservación digital se enfocaban en asegurar que los materiales pudieran sobrevivir a la obsolescencia técnica y las pérdidas por errores de gestión, o sea, que los materiales fueran administrados a lo largo de su ciclo de vida de modo que permanecieran accesibles a quienes los necesitaran. Esta era la tarea que por décadas y siglos realizaron las bibliotecas y los archivos, por lo que era natural que esos primeros informes de mediados de los años 90’s fueran una simple transposición de su tradición profesional a los soportes de información que estaban emergiendo, en particular en Internet.

Los estudios fueron revelando nuevos cuestiones y desafíos, más allá de la catalogación. Entonces se fueron creando metadatos apropiados para mejorar la accesibilidad y la recuperación, también para controlar los procedimientos de autenticación, o la creación de registros de auditoría para asegurar que el material no fuera alterado en el proceso por personas no autorizadas para hacerlo. Los contenidos deberían ser conservados de tal manera que permitiera ser usado y adaptado para nuevos fines, y eventualmente la creación de nuevos contenidos.

El concepto de “preservación digital” se fue elaborando y sofisticando, y cambia a una perspectiva dinámica y comprehensiva llamada la “continuidad digital”, lo que de acuerdo a The National Archives (USA) es “la habilidad de usar su información en la forma que usted desee por tanto tiempo como usted la requiera”.

Los tipos de materiales a preservar también van ampliando su alcance, pues además de las copias digitales de los contenidos analógicos y textuales, se van agregando los datos de la investigación científica, los registros de los procesos de la administración de gobierno, los recursos educativos en los repositorios digitales, los portales de revistas digitales de acceso abierto, los data-sets institucionales, series económicas, meteorológicas, etc. Esto abarca en particular todo lo producido y publicado en Internet (born-digital) que requiera ser preservado.

Las necesidades van delineando desafíos, no solamente tecnológicos, sino algo más importante, desafíos institucionales que no estaban planificados, y competencias profesionales que no eran comunes en el mercado. El tema central en la discusión es que las funciones normales de la biblioteca necesitan expandirse para incorporar las actividades relacionadas con la organización y la manipulación de datos y conjuntos de datos digitales, y para esas actividades no había ni recursos, ni disciplinas formales y mucho menos experiencia suficiente.

Un estudio reciente del mercado de trabajo sobre los conocimientos, aptitudes y habilidades solicitados para proyectos de preservación digital, establece como los tres más importantes de una larga lista: (1) ser capaz de trabajar en un entorno intensivo en tecnología; (2) dominio de estándares y especificaciones; y (3) dominio de herramientas y aplicaciones informáticas.

Desde el comienzo, los investigadores del área notaron deficiencias en las bibliotecas universitarias, en particular la escasez de profesionales con la formación adecuada para actuar y apoyar estas actividades. Afortunadamente hace unos cinco o seis años las cosas comenzaron a cambiar a nivel internacional. Para los interesados en el tema indicamos algunos centros de referencia.

  • University of California Curation Center creado en 2010 en sociedad con los 10 campus de la Universidad de California, toma la responsabilidad de todos los intereses digitales, desde museos y bibliotecas hasta los departamentos de investigación e investigadores individuales;
  • Programa DigCCurr, en la University of North Carolina at Chapel Hill, desde 2008 da cursos de postgrado en Digital Curation;
  • Luleå University of Technology in Sweden, de cursos de maestría en Digital Curation;
  • IFLA dedicó una sesión en su reciente congreso internacional en Puerto Rico, en 2011, a la educación en preservación digital¹;
  • The International Journal of Digital Curation es una revista en acceso abierto especialmente dedicada al tema de preservación digital.
  • La bibliografía más extensa y completa sobre el tema, con más de 90 páginas, fue publicada por Charles W. Bailey² el año pasado y está disponible en acceso abierto.

El desafío de garantizar la preservación a largo plazo y el acceso de los resultados de la investigación, especialmente los data-sets producidos por proyectos financiados con dineros públicos es un tema de gran prominencia en USA. Esta importancia se ha intensificado especialmente desde que en febrero de este año con el acto del legislativo norteamericano la Fair Access to Science and Technology Research Act (FASTR) que establece que todas las agencias federales deberán desarrollar un plan para colocar en acceso abierto los resultados de la investigación, y para ese objetivo han asignado 100 millones de dólares.

Sin embargo, la situación actual de las instituciones y recursos profesionales no es tan optimista de acuerdo a un estudio publicado el mes de noviembre pasado por el Council on Library and Information Resources³. Este estudio conocido como DataRes, que llevó dos años de duración, tuvo como objetivos: (1) estudiar y documentar las tendencias en los planes de administración y las políticas institucionales de investigación en respuesta a los requerimientos federales, (2) determinar cómo los profesionales de información pueden responder mejor a las necesidades emergentes de administrar los datos de investigación en las universidades.

El estudio detectó varias barreras que impiden una eficaz administración de los datos.

a. Falta de recursos económicos

Las instituciones no tienen en sus planes de inversión y gastos recursos suficientes para financiar los programas de preservación.

b. Falta de estructuras de organizativas

Las estructuras académicas son lentas para cambiar. Se basan en gran medida en las nociones de largo tiempo aceptadas como arquetipos funcionales.

c. Falta de Preparación Profesional

El Proyecto DataRes identificó la falta de capacitación, certificación, y otros tipos de preparación profesional como una deficiencia básica para disponer a los integrantes de la academia de forma favorable para la gestión de datos de investigación. Peor aún, en un nivel más fundamental, prácticamente nadie en el mundo académico percibe que tienen la responsabilidad profesional o el mandato para las funciones de gestión de datos de investigación. La falta de prioridad entre los investigadores fue un tema recurrente encontrado en el Proyecto DataRes que se explica en la razón de que los investigadores son recompensados sobre todo por la realización de nuevas investigaciones, y no para la gestión de los resultados de la investigación previa.

d. Falta de mandatos institucionales

No existen mandatos institucionales explícitos y conocidos para la gestión eficaz de los datos de investigación. La producción de datos en el curso de actividades de investigación siempre se ha entendido que forma parte de su tarea, pero la idea de que esos mismos investigadores deberían hacerse responsables de compartir los conjuntos acumulados de datos para avanzar en agendas de investigación más amplias es un concepto relativamente nuevo, que llegó a desarrollarse a partir de la experiencia de los grupos que trabajaron en el proyecto del genoma humano.

Esta falta de consenso resulta en la falta de mandatos institucionales o políticas concernientes a la administración de los datos. Sin mandatos institucionales, los datos de investigación podrán ser preservados en formas accesibles, o no ser preservados, porque la administración sistemática no ha llegado a ser una prioridad institucional.

Los costos elevados para mantener la infraestructura que garantice la continuidad digital de millones de artículos de revistas, gradualmente va siendo una tarea que supera a las instituciones individuales, a la mayoría de las universidades, a las bibliotecas nacionales y a la totalidad de las editoriales de los países emergentes, por lo que se van perfilando en el mercado al menos tres estrategias para enfrentar el problema.

  • Depósitos a cargo de grandes instituciones, como Los Alamos National Laboratory Research Library (LANL) o el depósito PANDORA de la National Library of Australia.
  • Depósitos de empresas privadas como Portico en Estados Unidos, que por una suscripción anual se hace cargo del almacenamiento y consulta.
  • Depósitos cooperativos como LOCKSS de la Universidad de Stanford, o la red asociada CLOCKSS. El Programa SciELO usa CLOCKSS para la preservación de las revistas SciELO Brasil.

En un congreso reciente en Barcelona sobre Preservación Digital³, el experto Martin Halbert, director de las bibliotecas de la Universidad de North Texas y presidente del sistema MetaArchive, un proyecto que vale la pena analizar, comentó que el problema actual es que no tenemos perspectiva histórica de la preservación digital, y nos hacen falta buenas prácticas. Comentó también que hasta ahora la preservación se basa sobre todo en el criterio de “no poner todos los huevos en el mismo cesto”, y, por ejemplo, en MetaArchive conservan 6 copias en lugares distintos de 15.000 tesis, usando el software Lockss.

Halbert comentó también que no es partidario de usar servicios de almacenamiento en la nube y que prefiere tener los ficheros en diferentes localidades pero en ordenadores propios porque desconfía de las empresas que dan ese servicio.

La continuidad digital es el gran desafío que enfrentamos todos los países emergentes para mantener nuestra presencia en el Web. Se ha ganado por cierto un lugar importante a través del Programa SciELO que ha estado creciendo durante 15 años. Pero será necesario incorporar a nuestras responsabilidades la preparación en cada uno de nuestros países a profesionales capacitados y establecer las políticas y las infraestructuras tecnológicas necesarias. La experiencia de SciELO que ha comenzado con CLOCKSS puede ser muy instructiva para todos nosotros.

Debemos mantenernos atentos para aprender.

Notas

¹ World Library and Information Congress : 77th IFLA General Conference and Assembly. August 2011, San Juan, Puerto Rico. Available from: <http://conference.ifla.org/past/2011/education-and-training-section-with-preservation-and-conservation-information-techno.htm>.

² Bailey, C. W. Digital Curation Bibliography: Preservation and Stewardship of Scholarly Works. 2012. Available from: <http://digital-scholarship.org/dcbw/dcb.htm>.

³ Aligning National Approaches to Digital Preservation: An Action Assembly Biblioteca de Catalunya. National Library of Catalonia. November  2013. Available from <http://www.educopia.org/events/ANADPII>.

Referencias

The commission on preservation and access and the research libraries group. Report of the task force on archiving of digital information. 1996. Available from:<http://www.clir.org/pubs/reports/pub63watersgarrett.pdf>.

The National Archives. Understanding digital continuity. 2011, version 1.2. Available from: <http://www.nationalarchives.gov.uk/documents/information-management/understanding-digital-continuity.pdf>.

H.R. 708: Fair Access to Science and Technology Research Act of 2013. 2013. 113th Congress. Available from: <https://www.govtrack.us/congress/bills/113/hr708/text>.

Council on Library and Information Resources. Research Data Management Principles, Practices, and Prospects. Nov. 2013. Available from: <http://www.clir.org/pubs/reports/pub160>.

KIM, J., WARGA, E., and MOEN, W.E. Competencies Required for Digital Curation: An Analysis of JobAdvertisements. 2013, vol. 8, nº 1, pp. 66-83.

Enlaces externos

University of California Curation Center – http://www.cdlib.org/services/uc3/

DigCCurr – http://ils.unc.edu/digccurr

Luleå University of Technology – http://www.ltu.se/edu/program/FMDBA?l=en

International Journal of Digital Curation – http://www.ijdc.net/

Portico – http://www.portico.org/

LOCKSS – http://www.lockss.org/

CLOKSS – http://www.clockss.org/clockss/Home

MetaArchive – http://www.metaarchive.org/

 

Ernesto SpinakSobre Ernesto Spinak

Colaborador do SciELO, Ingeniero en Sistemas y Lic. en Biblioteconomía,  con  Diploma de Estudios Avanzados pela Universitat Oberta de Catalunya y Maestría en “Sociedad de la Información” por la Universidad Oberta de Catalunya, Barcelona – España.  Actualmente tiene una empresa de consultoría que atiende a 14 instituciones de gobierno y universidades en Uruguay con proyectos de información.

 

Como citar este post [ISO 690/2010]:

SPINAK, E. Preservación: la construcción de la continuidad digital [online]. SciELO en Perspectiva, 2014 [viewed ]. Available from: https://blog.scielo.org/es/2014/01/02/preservacion-la-construccion-de-la-continuidad-digital/

 

One Thought on “Preservación: la construcción de la continuidad digital

  1. Muy clarificador para quienes estén relacionados con planificar y gestionar repositorios digitales o estén involucrados en publicación en línea. Gracias!

Leave a Reply to Mg. Silvia Storani Cancel reply

Your email address will not be published.

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Post Navigation