Nas iniciativas de acesso aberto à publicação online, cujo impulso e volume se converteram em uma força avassaladora nos últimos anos, torna-se cada vez mais importante considerar o problema da preservação dos conteúdos em longo prazo.
Um dos primeiros sinais que advertiu sobre o desafio e o problema da preservação digital foi lançado em 1996 em um relatório elaborado pela Research Libraries Group, um consórcio de bibliotecas com base nos Estados Unidos, que, em 2006, juntou-se ao Online Computer Library Center (OCLC) integrando WorldCat. Estes relatórios iniciais e análise dos problemas da preservação digital estavam focados em garantir que os materiais poderiam sobreviver a obsolescência técnica e perdas por erros de gestão, ou seja, que os materiais foram geridos durante todo seu ciclo de vida de modo que permaneçam acessíveis para aqueles que os necessitem. Esta foi a tarefa à qual se dedicaram ao longo de décadas e séculos as bibliotecas e arquivos, motivo pelo qual era natural que os primeiros informes de meados dos anos 90 eram uma simples transposição de sua tradição profissional aos suportes de informação que foram surgindo, particularmente a Internet.
Os estudos foram revelando novas questões e desafios além da catalogação. Então, foram criados metadados apropriados para melhorar a acessibilidade e a recuperação, também para controlar procedimentos de autenticação, ou a criação de registros de auditoria para garantir que o material não fosse alterado durante o processo por pessoas não autorizadas a fazê-lo. Os conteúdos deveriam ser preservados de modo que pudessem ser usados e adaptados para novas finalidades, e, eventualmente, para a criação de novos conteúdos.
O conceito de “preservação digital” foi sendo desenvolvido e sofisticado, e muda para uma perspectiva dinâmica e abrangente denominada “continuidade digital”, o que, de acordo com o The National Archives (EUA) é “a capacidade de usar a sua informação na forma que você desejar, por tanto tempo quanto você precise”.
Os tipos de materiais para preservar também irão expandir o seu alcance, pois além das cópias digitais dos conteúdos analógicos e textuais, se agregam dados da pesquisa científica, registros de processos de gerenciamento de registros do governo, recursos educacionais em repositórios digitais, portais de periódicos digitais em acesso aberto, data-sets institucionais, séries econômicas, meteorológicas, etc. Isto abrange, em especial, todos os conteúdos produzidos e publicados na Internet (born-digital) que precisa ser preservado.
As necessidades vão delineando desafios, não só tecnológicos, mas o mais importante, desafios institucionais que não foram planejados, e habilidades profissionais que não eram comuns no mercado. O tema central da discussão é que as funções normais da biblioteca precisam ser expandidas para incluir atividades relacionadas à organização e manipulação de dados e conjuntos de dados digitais, e para essas atividades não havia recursos, ou disciplinas formais, muito menos experiência suficiente.
Um estudo recente do mercado de trabalho sobre os conhecimentos, aptidões e habilidades solicitados para projetos de preservação digital estabelecem como os três primeiros de uma longa lista: (1) ser capaz de trabalhar em um ambiente intensivo de tecnologia, (2) o domínio de normas e especificações, e (3) domínio de ferramentas e aplicativos informáticos.
Desde o início, os pesquisadores da área notaram deficiências nas área de bibliotecas universitárias, particularmente a escassez de profissionais devidamente treinados para agir e apoiar essas atividades. Felizmente, há cerca de cinco ou seis anos, as coisas começaram a mudar a nível internacional. Para os interessados no tema indicamos alguns centros de referência:
- University of California Curation Center criado em 2010, em parceria com os 10 campi da Universidade da Califórnia, assume a responsabilidade de todos os interesses digitais, de museus a bibliotecas até os departamentos de pesquisa e pesquisadores individuais;
- Programa DigCCurr na University of North Carolina at Chapel Hill, desde 2008 dá cursos de pós-graduação em Digital Curation;
- Luleå University of Technology na Suécia, tem cursos de mestrado em Digital Curation;
- International Digital Curation Education and Action (IDEA) Working Group é uma aliança internacional que analisa e aconselha sobre necessidades curriculares para a construção de competências profissionais;
- IFLA dedicou uma sessão na recente conferência internacional em Porto Rico, em 2011 , à educação em preservação digital¹;
- The International Journal of Digital Curation é uma revista de acesso aberto dedicada especificamente à questão da preservação digital;
- A bibliografia mais extensa e abrangente sobre o assunto, com mais de 90 páginas , foi publicada por Charles W. Baiely² no ano passado e está disponível em acesso aberto.
O desafio de garantir a preservação em longo prazo e acesso aos resultados de pesquisa, em especial os data-sets produzidos por projetos financiados com dinheiro público é um tema de grande destaque nos EUA. Essa importância se intensificou especialmente desde fevereiro deste ano, com o projeto de lei norte-americano Fair Access to Science and Technology Research Act (FASTR), que estabelece que todas as agências federais devem desenvolver um plano para colocar em acesso aberto os resultados da pesquisa, sendo que para este projeto foram alocados 100 milhões de dólares.
No entanto, a situação atual das instituições e recursos profissionais não é tão otimista, de acordo com um estudo publicado em novembro passado pelo Council on Library and Information Resources³ . Este estudo, conhecido como DataRes, que levou dois anos para ser concluído, teve como objetivos: (1) estudar e documentar as tendências dos planos de gestão e políticas institucionais de pesquisa em resposta às exigências federais e (2) determinar como os profissionais de informação podem melhor responder às necessidades emergentes de gerenciamento de dados de pesquisa em universidades.
O estudo identificou várias barreiras para o gerenciamento eficaz de dados:
a. Falta de recursos financeiros
As instituições não têm em seus planos de investimento e despesas os recursos adequados para financiar programas de preservação.
b. A falta de estruturas organizacionais
As estruturas acadêmicas são lentas para mudar. Eles se baseiam fortemente em noções de longo prazo aceitas como arquétipos funcionais.
c. Falta de Preparação Profissional
O Projeto DataRes identificou a falta de formação, certificação e outros tipos de preparação profissional como uma deficiência básica para fornecer aos membros da academia de forma favorável para a gestão de dados de pesquisa. Pior, em um nível mais fundamental, praticamente ninguém na academia percebe ter uma responsabilidade profissional ou mandato para funções de gerenciamento de dados de pesquisa. A falta de prioridade entre os pesquisadores foi um tema recorrente encontrado no Projeto DataRes, que se explica em razão de que os pesquisadores são recompensados principalmente por novas pesquisas, não pela gestão dos resultados de pesquisa anteriores.
d. Falta de mandatos institucionais
Existem mandatos institucionais explícitos e conhecidos para a gestão eficaz de dados de pesquisa. A produção de dados no decurso das atividades de pesquisa sempre foi entendida como parte de sua tarefa, mas a ideia de que esses mesmos pesquisadores deveriam assumir a responsabilidade de compartilhar os conjuntos de dados acumulados para avançar nas agendas de pesquisa mais amplas é um conceito relativamente novo, que veio a ser desenvolvido a partir da experiência dos grupos que trabalharam no projeto genoma humano.
Esta falta de consenso resulta na falta de mandatos institucionais ou políticas relativas à gestão de dados. Sem mandatos institucionais, os dados da pesquisa poderão ser preservados de forma acessível, ou não ser preservados, porque a administração sistemática não chegou a ser uma prioridade institucional.
Os altos custos para manter a infraestrutura que garanta a continuidade digital de milhões de artigos de periódicos, gradualmente se torna uma tarefa que supera as instituições individuais, a maioria das universidades, as bibliotecas nacionais e todas as editoras de países emergentes, motivos pelos quais emergem ao menos três estratégias para enfrentar o problema.
- Os depósitos de grandes instituições como Los Alamos National Laboratory Research Library (LANL), o depósito PANDORA, ou a National Library of Australia.
- Depósitos de empresas privadas, como a Portico nos Estados Unidos, que por uma taxa de assinatura anual cuida do armazenamento e recuperação.
- Depósitos cooperativos como LOCKSS, da Universidade de Stanford ou a rede associada a CLOKSS. O programa SciELO usa a CLOCKSS para a preservação dos periódicos de SciELO Brasil.
Em um recente congresso em Barcelona sobre Preservação Digital³, o especialista Martin Halbert, diretor das bibliotecas da Universidade do Norte do Texas e presidente do sistema MetaArchive, um projeto que vale a pena analisar, afirmou que o problema atual é que nós não temos nenhuma perspectiva histórica sobre preservação digital, e falta-nos boas prática. Até agora, a preservação é baseada principalmente no critério de “não colocar todos os ovos na mesma cesta”, e, por exemplo, MetaArchive conserva seis cópias em distintos lugares de 15.000 teses, usando o software LOCKSS.
Halbert também disse que não é a favor do uso de serviços de armazenamento em nuvem e prefere ter os arquivos em locais diferentes, mas em computadores próprios porque desconfia das empresas que prestam este serviço.
A continuidade digital é o grande desafio que todos os países emergentes enfrentam para manter a presença na Web. Estes países ganharam um lugar importante através do programa SciELO, que vem crescendo há 15 anos. Mas será necessário incorporar às nossas responsabilidades a preparação em cada um dos nossos países de profissionais treinados e estabelecer políticas e infraestruturas tecnológicas necessárias. A experiência que SciELO iniciou com CLOCKSS pode ser muito instrutiva para todos nós.
Temos de estar vigilantes para aprender.
Notas
¹ World Library and Information Congress : 77th IFLA General Conference and Assembly. August 2011, San Juan, Puerto Rico. Available from: <http://conference.ifla.org/past/2011/education-and-training-section-with-preservation-and-conservation-information-techno.htm>.
² Bailey, C. W. Digital Curation Bibliography: Preservation and Stewardship of Scholarly Works. 2012. Available from: <http://digital-scholarship.org/dcbw/dcb.htm>.
³ Aligning National Approaches to Digital Preservation: An Action Assembly Biblioteca de Catalunya. National Library of Catalonia. November 2013. Available from <http://www.educopia.org/events/ANADPII>.
Referências
The commission on preservation and access and the research libraries group. Report of the task force on archiving of digital information. 1996. Available from:<http://www.clir.org/pubs/reports/pub63watersgarrett.pdf>.
The National Archives. Understanding digital continuity. 2011, version 1.2. Available from: <http://www.nationalarchives.gov.uk/documents/information-management/understanding-digital-continuity.pdf>.
H.R. 708: Fair Access to Science and Technology Research Act of 2013. 2013. 113th Congress. Available from: <https://www.govtrack.us/congress/bills/113/hr708/text>.
Council on Library and Information Resources. Research Data Management Principles, Practices, and Prospects. Nov. 2013. Available from: <http://www.clir.org/pubs/reports/pub160>.
KIM, J., WARGA, E., and MOEN, W.E. Competencies Required for Digital Curation: An Analysis of JobAdvertisements. 2013, vol. 8, nº 1, pp. 66-83.
Link Externo
University of California Curation Center – http://www.cdlib.org/services/uc3/
DigCCurr – http://ils.unc.edu/digccurr
Luleå University of Technology – http://www.ltu.se/edu/program/FMDBA?l=en
International Journal of Digital Curation – http://www.ijdc.net/
Portico – http://www.portico.org/
LOCKSS – http://www.lockss.org/
CLOKSS – http://www.clockss.org/clockss/Home
MetaArchive – http://www.metaarchive.org/
Sobre Ernesto Spinak
Colaborador do SciELO, engenheiro de Sistemas e licenciado en Biblioteconomia, com diploma de Estudos Avançados pela Universitat Oberta de Catalunya e Mestre em “Sociedad de la Información” pela Universidad Oberta de Catalunya, Barcelona – Espanha. Atualmente tem uma empresa de consultoria que atende a 14 instituições do governo e universidades do Uruguai com projetos de informação.
Como citar este post [ISO 690/2010]:
Pingback: Preservação: a construção da continuidade digital | Sistema de Bibliotecas UCS - Blog
Pingback: Preservação: a construção da continuidade digital | Blog da BC
Pingback: Texto: “Preservação: a construção da comunidade digital” | Blog
Pingback: Como citar este post [ISO 690/2010] | Blog