Por Ernesto Spinak e Abel L. Packer
Scientific Data1 é uma nova forma de publicação periódica online em acesso aberto para descrever os datasets de pesquisas valiosas. É desta forma que se apresenta na mesma introdução a esta nova iniciativa do grupo Nature Publication Group (NPG), que estará em operação a partir de maio de 2014.
O objetivo do projeto Scientific Data é promover a documentação, intercambio e reutilização dos dados que sustentam as pesquisas, em modo aberto, para acelerar o passo das descobertas científicas. Para atingir este objetivo se introduz um novo tipo de metadado chamado Data Descriptor. Estes metadados poderiam servir a uma aspiração que progressivamente vem sendo solicitada pelos pesquisadores, agências de fomento, sociedades acadêmicas, periódicos, publishers e indexadores, para que os dados científicos estejam publicamente disponíveis, citáveis, e reprodutíveis, e que proporcionem mecanismos de revisão que assegurem a qualidade e o cumprimento das normas da comunidade científica.
O Programa SciELO definiu como uma de suas linhas de ação a promoção e implantação de soluções de organização, descrição, publicação e indexação dos dados das pesquisas científicas publicadas nos periódicos SciELO de modo a aumentar a visibilidade e impacto das pesquisas e dos artigos associados. A proposta que a Diretoria do SciELO vem trabalhando é a criação do SciELO Data compatível com as soluções internacionais de indexação e publicação de dados científicos e implantada com o mesmo modelo dos outros componentes do SciELO, a saber, como uma rede de coleções de datasets das pesquisas publicadas pelos periódicos SciELO. Esta linha de ação foi um dos temas abordados na Conferência SciELO 15 Anos.
Uma questão importante e de consenso neste movimento é a necessidade de assegurar a interoperabilidade nos dados.
A Research Data Alliance (RDA) é uma iniciativa em curso orientada à busca de soluções de descrição e interoperabilidade de dados. A aliança foi lançada em março de 2013 com o objetivo explícito de aperfeiçoar o intercambio de dados. Desde então a aliança se desenvolve através de Grupos de Trabalho e Grupos de Interesse que são responsáveis por definir soluções para superar as barreiras para compartilhar dados. Com base nas experiências de trabalho multidisciplinar, o projeto da RDA considera o desenvolvimento de building blocks de infraestruturas comuns, assim como de soluções específicas de data bridges.
Além de acompanhar o desenvolvimento das diferentes iniciativas, SciELO participa da proposta da FAIRPORT que propõe o estabelecimento de uma solução aberta para a operação de metadados e serviços de interoperabilidade. O projeto FAIRPORT realizou sua primeira reunião internacional em Leiden, entre os dias 13 e 16 de janeiro de 2014 e os resultados serão publicados em breve e divulgaremos neste blog.
No que se refere à interoperabilidade, Scientific Data adotou seis princípios chaves que estão alinhados com os avanços e iniciativas que vem ocorrendo na comunicação de dados científicos:
- Permitir que os datasets publicados em acesso aberto, mediante mecanismos de citação e índices de citação, gerem os créditos e reconhecimentos apropriados a seus autores, que de outro modo não são registrados nos artigos tradicionais dos periódicos.
- A descrição normalizada dos Data Descriptors permitirá a recuperação, interpretação e preservação dos dados, o que facilitará o intercambio destes em sucessivas pesquisas por equipes independentes.
- Um sistema de revisão proporcionado por NPG assegurará a qualidade e preservação das descrições.
- A normalização dos Data Descriptors permitirá dispor de interfaces uniformes de recuperação e um sistema validado de links entre os repositórios de dados e os artigos publicados em periódicos relacionados.
- Publicados sob alguma das licenças CC 3.0, permitirá o uso aberto aos dados e a criação de obras derivadas.
- A tecnologia de NPG assegurará que os conteúdos sejam compatíveis com os principais repositórios de datasets atuais, como Figshare ou Dryad.
Os metadados Data Descriptors agregam um nível de descrição que os artigos tradicionais de periódicos não contém. Este tipo de metadados inclui informação sobre o gênesis ou criação dos datasets, os passos do experimento, e como se vinculam com outros datasets. Assim mesmo, os Data Descriptors, poderão estar associados aos artigos publicados em um amplo conjunto de periódicos, não somente aqueles publicadas por NPG. Os Data Descriptors estarão disponíveis em Acesso Aberto CC 3.0, e serão publicados mediante o pagamento pelo autor de uma taxa de publicação (article-processing charge, APC).
O projeto Scientific Data começará a publicar os datasets a partir de maio de 2014, os quais serão avaliados, processados e armazenados em repositórios associados ao projeto, que hoje em dia são: Data Dryad; Biosharing; Figshare; ISA-Tools. As disciplinas que estão disponíveis no momento são as ciências da vida, biomédicas e ambientais. Os pesquisadores de outras disciplinas devem solicitar instruções antes de enviar dados.
Os Data Descriptors poderão ser citados, e num futuro próximo serão incluídos em PubMed, Scopus, WoS e outros serviços principais de indexação. Com estes dados se antecipa que, para o ano de 2016, poderão ser geradas métricas de medida de influencia e impacto dos datasets. Certamente SciELO, Google Scholar, CROSSREF e outros índices participarão dos processos de indexação, busca e interoperabilidade dos datasets.
A estrutura destes metadados como é apresentada pela Scientific Data pode parecer um pouco complexa para a maioria dos autores (foram idealizados para ser processados por máquina), mas não é necessário que os autores estejam familiarizados com os detalhes das especificações, pois estes metadados poderão ser criados automaticamente usando os programas de que dispõe o projeto Scientific Data, uma vez que a informação tenha sido aceita pelo processo de revisão. De todas as maneiras, os usuários avançados poderão gerar seus próprios Data Descritpors usando as especificações de metadados, uma vez que as normas estarão disponíveis publicamente.
O site do projeto Scientific Data oferece, além disso, as seguintes seções:
- Pautas de apresentação contendo informação detalhada para ajudar os autores a preparar o formato e apresentar um manuscrito para gerar os Data Descriptors2.
- Conselho Editorial e Assessor, composto por 26 representantes especialistas procedentes da academia, repositórios de dados, e agências de fomento3.
- Conselho Editorial, composto por mais de 70 especialistas dos campos da ciência que inclui esta iniciativa, que fará a avaliação dos dados enviados4.
- Instruções aos autores5.
- Instruções para avaliação6.
- Custo de publicação (APC)7.
- Exemplos da estrutura dos Data Descriptors8.
Devido ao incremento exponencial dos dados que produzem os laboratórios de pesquisa, e os requisitos que de forma crescente impõe às agencias que patrocinam estas pesquisas referentes à preservação, reutilização e interoperabilidade dos dados, é importante que os laboratórios, grupos de pesquisadores e pesquisadores individualmente comecem a fazer planos de administração de seus datasets de modo compatível com as soluções estandardizadas que estão sendo elaboradas. A publicação dos Data Descriptors permitirá aos autores cumprir uma parte significativa dos planos de administração de dados requeridos pelos financiadores e fornece uma prova demonstrável deste plano.
O tema da comunicação de dados científicos é um dos tópicos que o blog SciELO em Perspectiva irá priorizar no futuro com contribuições das diferentes partes interessadas.
Mantenha-se alerta, participe com posts e/ou comentários.
Notas
1 Scientific Data – http://www.nature.com/scientificdata/
2 Submitting experimental metadata – http://www.nature.com/scientificdata/for-authors/submission-guidelines/#metadata
³Editors and Advisory Panel – http://www.nature.com/scientificdata/editors-and-advisory-panel/
⁴Editorial Board – http://www.nature.com/scientificdata/editorial-board/
5 For Authors- http://www.nature.com/scientificdata/for-authors
6 Guide to referees – http://www.nature.com/scientificdata/guide-to-referees/
7 Open Access – http://www.nature.com/scientificdata/open-access/
8 Sample Data Descriptors – http://www.nature.com/scientificdata/for-authors/sample-data-descriptors/
Links externos
Lorentz Center – http://www.lorentzcenter.nl/lc/web/2014/602/info.php3?wsid=602&venue=Snellius
Scientific Data – http://www.nature.com/scientificdata/
Research Data Alliance – https://rd-alliance.org/
Data Dryad – http://datadryad.org/
Biosharing – http://biosharing.org/
Figshare – http://figshare.com/
ISA-Tools – http://isa-tools.org/
Fairport 1st Meeting – http://www.lorentzcenter.nl/lc/web/2014/602/info.php3?wsid=602&venue=Snellius
Sobre Ernesto Spinak
Colaborador do SciELO, engenheiro de Sistemas e licenciado en Biblioteconomia, com diploma de Estudos Avançados pela Universitat Oberta de Catalunya e Mestre em “Sociedad de la Información” pela Universidad Oberta de Catalunya, Barcelona – Espanha. Atualmente tem uma empresa de consultoria que atende a 14 instituições do governo e universidades do Uruguai com projetos de informação.
Como citar este post [ISO 690/2010]:
Últimos comentários