Os artigos dos periódicos SciELO nas plataformas de Ciência Aberta da Comissão Europeia

Por Abel L. Packer e Gustavo Fonseca

A partir de março de 2018 os artigos publicados pelos periódicos SciELO passam a integrar e usufruir das funcionalidades oferecidas por dois importantes projetos de desenvolvimento e operação de fontes de gestão de informação científica de acesso aberto da Comissão Europeia que são apoiadas pelo programa Horizon 2020 de financiamento de pesquisa, desenvolvimento tecnológico e inovação. O primeiro é o repositório OpenAire que compreende metadados de publicações, dados de pesquisa, projetos e organizações, serve de referência e apoio às políticas e mandatos europeus de acesso aberto, dados abertos e alinhamento com as práticas da ciência aberta. O segundo projeto implementa o sistema OpenMinTeD (Open Mining Infrastructure for Text and Data), que compreende uma infraestrutura aberta de serviços orientada à mineração de textos e dados de pesquisa científica.

Em março de 2018 o volume de conteúdo aberto operado pelo OpenAire é notável em quantidade, que se expressa na indexação e disponibilização para buscas mais de 23 milhões registros bibliográficos de publicações científicas, das quais cerca de 14 milhões são artigos de periódicos. O OpenAire indexa também mais de 600 mil registros de dados de pesquisa. Esses conteúdos são extraídos por meio de rastreadores web (web crawlers) que visitam periodicamente mais de 11 mil repositórios e periódicos em acesso aberto, denominados “provedores de dados” (data providers).

Os provedores de dados devem atender aos requisitos exigidos pelo OpenAire para expor ou disponibilizar seus conteúdos segundo protocolos que permitem aos rastreadores do OpenAire realizar a extração ou coleta (harvesting) dos metadados de artigos e outros tipos de literatura científica, como dados de pesquisa ou documentos de projetos. O protocolo seguido pelo OpenAire para a extração dos metadados das publicações científicas é a versão 2.0 do Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH v2.0). Os conteúdos expostos devem permitir a extração dos metadados requeridos pelo OpenAire (Set Content) e organizados segundo o formato Dublin Core. Um dos metadados é o link para o conteúdo original.

No final de 2017 e início de 2018, o SciELO desenvolveu a capacidade de organizar os metadados dos artigos SciELO requeridos pelo OpenAire no formato Dublin Core e de disponibilizá-los na condição de agregador segundo o protocolo OAI-PMH v2.0.

O OpenMinTED opera também com provedores de conteúdo, seja de publicações ou de dados de pesquisa. Mas, a diferente do OpenAire, o OpenMinTED opera com cópias dos dados originais, como são os textos completos no caso das publicações científicas. Para acessar os textos completos e outros tipos de conteúdo, o OpenMinTED faz uso dos metadados do OpenAire. Ou seja, provedores de dados para o OpenMinTED devem previamente constituir-se como provedor do OpenAire.

No início de 2018 o SciELO desenvolveu também a capacidade de ser provedor de dados do OpenMinTED que resultará na disponibilização dos textos completos de todos os artigos cuja licença Creative Commons permite derivativos dos textos.

A plataforma operacional do OpenMinTED está em desenvolvimento compreendendo as funções ou serviços de disponibilização aberta dos conteúdos para uso de aplicações de mineração de textos e dados, assim como de ferramentas e soluções de exploração dos conteúdos e seus resultados. A mineração de dados consiste em processamentos conduzidos por programas de computador especializados em técnicas de análise exaustiva de textos não estruturados e de dados estruturados, visando a identificação de estruturas, padrões e tendências que venham a informar e automatizar processos de tomadas de decisão. Essa função de descobrir ou revelar estruturas e padrões a partir da análise de textos e dados é interpretada comumente como extração de conhecimento previamente desconhecido.

O desenvolvimento da capacidade de provedor de dados do SciELO tanto para o OpenAire quanto para o OpenMinTED foi apoiado por um auxílio de 25 mil euros aportados pelo projeto OpenMinTED em chamada pública de projetos para apoiar o desenvolvimento da plataforma. A unidade técnica do SciELO Brasil, com apoio da coordenação do SciELO Espanha e da Oficina Técnica General (OTG) del Plan TL en el área de Biomedicina de la Secretaria de Estado de Telecomunicaciones y para la Sociedad de la Información elaborou e submeteu uma proposta de projeto1 segundo os termos da chamada pública para tornar-se provedor de dados, que foi aprovada pelo comitê responsável pela avaliação das propostas. Em resumo, o projeto do SciELO solicitou apoio para o desenvolvimento da organização dos metadados dos artigos segundo o formato Dublin Core e sua exposição segundo o protocolo OAI-PMH v2.0. O resultado do projeto enriquece a plataforma tecnológica do SciELO. O código é aberto, disponível sob licença BSD. Vale destacar que todo o tráfego entre o provedor OAI e o cliente é criptografado, por meio do uso do protocolo HTTPS.

A presença dos artigos dos periódicos SciELO nas plataformas OpenAire e OpenMinTED contribuirá para o objetivo do programa de promover a visibilidade, uso e impacto dos periódicos indexados pelas coleções nacionais da Rede SciELO e das pesquisas que comunicam. O programa SciELO tem como princípios a comunicação das pesquisas em acesso aberto, o trabalho em rede e o controle de qualidade em todas as instâncias e etapas do processo editorial. O programa opera mediante um modelo de publicação de periódicos que integra as funções de indexação, armazenamento, preservação e recuperação de textos completos, publicação e interoperabilidade. Em resumo, o SciELO busca maximizar a disponibilização e uso dos periódicos e dos artigos. No caso do OpenMinTED, a perspectiva de identificação de nova informação e conhecimento a partir da análise dos textos dos artigos contribuirá para ampliar a visibilidade e impacto dos resultados das pesquisas que comunicam.

Nota

1. Proposta redigida por Fabio Batalha e Abel Packer intitulada “Proposal to empower SciELO Network to provide journals article in the OpenMinTED platform through the OpenAire repository” enviada para o OpenMinTED em 2017.

Referências

OpenAIRE Guidelines for Literature Repositories [online]. OpenAIRE Guidelines. 2015 [viewed 09 February 2018]. Available from: https://guidelines.openaire.eu/en/latest/literature/index.html

Phase II: call for TDM Software and Knowledge Resources [online]. Open Tenders. 2017 [viewed 09 February 2018]. Available from: https://openminted.bsc.es/

What is Horizon 2020? [online]. European Comission. 2014 [viewed 09 February 2018]. Available from: https://ec.europa.eu/programmes/horizon2020/what-horizon-2020

Links externos

Dublin Core Metadata Element Set, Version 1.1: Reference Description <http://dublincore.org/documents/dces/>

OpenAIRE <https://www.openaire.eu/>

OpenAIRE Guidelines <https://guidelines.openaire.eu/en/latest/>

OpenMinTED Glossary <https://vocabularies.openminted.eu/skosmos/omtd_glossary/en/page/OMTDglossary>

Provedor de dados OAI-PMH para Rede SciELO <https://github.com/scieloorg/oai-pmh>

The Open Archives Initiative Protocol for Metadata Harvesting <http://www.openarchives.org/OAI/openarchivesprotocol.html>

 

Como citar este post [ISO 690/2010]:

PACKER, A.L. and FONSECA, G. Os artigos dos periódicos SciELO nas plataformas de Ciência Aberta da Comissão Europeia [online]. SciELO em Perspectiva, 2018 [viewed ]. Available from: https://blog.scielo.org/blog/2018/03/09/os-artigos-dos-periodicos-scielo-nas-plataformas-de-ciencia-aberta-da-comissao-europeia/

 

One Thought on “Os artigos dos periódicos SciELO nas plataformas de Ciência Aberta da Comissão Europeia

  1. Pingback: Boletim de Notícias: Poluição por metais pesados atinge ilhas remotas, diz estudo | Direto da Ciência

Leave a Reply

Your email address will not be published. Required fields are marked *

Post Navigation