O repositório de dados SciELO Data em operação regular

Por Solange Santos, Carolina Tanigushi e Abel L Packer

Logo do SciELO Data

O terceiro ciclo de desenvolvimento do Programa SciELO prevê seu posicionamento enquanto um programa de ciência aberta. Neste sentido, o Programa SciELO passa a incorporar formalmente as práticas de Ciência Aberta nos seus princípios e na formulação da estratégia, objetivos, funções e planos de trabalho do Modelo SciELO de Publicação.1

Nesse novo modus operandi, cabe a cada um dos periódicos renovar sua política e gestão editorial em prol da aceitação de manuscritos depositados em servidores confiáveis de preprints, a citação, referenciamento e compartilhamento de conteúdos subjacentes aos textos dos artigos e o oferecimento de opções que promovam maior transparência e qualidade no processo de avaliação por pares.

Em agosto de 2020 foi lançado o repositório de dados SciELO Data que operou de forma experimental até janeiro de 2022. O SciELO Data tem escopo multidisciplinar e opera o depósito, preservação e disseminação de dados de pesquisa de artigos submetidos, aprovados para publicação ou já publicados em periódicos da Rede SciELO ou postados no SciELO Preprints. Os dados de pesquisa são operados na forma de arquivos digitais de dados numéricos, códigos de aplicações computacionais, textos, esquemas e outros conteúdos subjacentes aos textos dos artigos.

O SciELO Data utiliza a plataforma de código aberto Dataverse, desenvolvida pelo Instituto de Ciências Sociais Quantitativas (Institute for Quantitative Social Science, IQSS) da Universidade de Harvard. Em junho de 2022, existem 79 repositórios de dados operando com o Dataverse espalhados pelo mundo.

Um repositório datarverse permite recursivamente a hospedagem de diversas coleções, ou repositórios dataverses. No contexto do SciELO Data, cada periódico tem seu dataverse próprio assim como o servidor SciELO Preprints. Eventualmente, pode ter mais de um dataverse. Os periódicos são responsáveis pela gestão dos seus dataverses o apoio da equipe SciELO permitindo que o compartilhamento de dados de pesquisa seja feito de acordo com as políticas editoriais de cada periódico e especificidades das comunidades de pesquisa.

Os dataverses são compostos por conjuntos de arquivos de dados, ou datasets. Cada conjunto e cada um dos seus arquivos vêm sempre acompanhados de metadados. Desta forma, além de armazenar, preservar e publicar dados de pesquisa, os periódicos SciELO aumentarão a visibilidade das pesquisas por meio do compartilhamento, a citação, a exploração e a análise de dados de pesquisa.

Diagrama mostrando os níveis da coleção dataverse do SciELO Data. A coleção do dataverse SciELO Data engloba os dataverses do periódicos que possuem os conjuntos de dados dentro de si.

Neste contexto, o fluxo de trabalho do SciELO Data ocorre da seguinte forma:

  1. Os pesquisadores preparam o conjunto de dados durante a sua pesquisa (arquivos dados numéricos em diferentes formatos, códigos de aplicativos de computador, documentos, esquemas, áudios, vídeos etc.) seguindo o Guia de preparação de dados de pesquisa;2
  2. O depósito do conjunto de dados no dataverse do periódico no SciELO Data é feito seguindo o Guia de depósito de dados de pesquisa;3
  3. Os pesquisadores enviam o conjunto de dados para curadoria da equipe editorial do periódico;
  4. O periódico recebe notificação do SciELO Data informando sobre o depósito de um conjunto de dados;
  5. O periódico realiza curadoria do conjunto de dados de acordo com as instruções do guia de curadoria de dados de pesquisa para equipes editoriais;4
  6. Estando o conjunto de dados dentro dos padrões estabelecidos, o periódico informa a equipe SciELO Data que o conjunto de dados já está disponível para curadoria da equipe SciELO;
  7. A equipe SciELO Data revisa o conjunto de dados;
  8. SciELO informa a equipe editorial do periódico que a revisão foi concluída; e,
  9. Equipe editorial decide sobre a publicação do conjunto de dados.

Fluxograma do SciELO Data

Na promoção da visibilidade das pesquisas, o conteúdo do repositório SciELO Data é indexado e recuperável por alguns dos mais importantes serviços de busca e indexação de dados, tais como: Google, Dataset Search, Re3Data, FAIRSharing, Repository Finder e Ranking web of repositories.

A adoção de práticas de ciência aberta como um todo presume a revisão e enriquecimento de metodologias e conceitos e desafios para agregar novas funcionalidades, que muitas vezes são percebidas como disruptivos à comunicação científica.

Nesse sentido, um dos maiores desafios para a consolidação do SciELO Data está justamente em dificuldades e resistências dos pesquisadores em avançar no compartilhamento dos dados das suas pesquisas e dos periódicos em atualizar suas políticas editoriais para transformar o compartilhamento de dados como uma prática integrada ao processo editorial. Soma-se a isso o tempo e energia necessários para o aprendizado e implementação dessas mudanças que demandam de diversos atores (autores, pareceristas, editores, equipes editoriais) uma nova atuação alinhada com o modus operandi da Ciência Aberta.

Como um repositório de dados confiável o SciELO Data tem, além da preservação de longo prazo dos dados de pesquisa, a função de facilitador no compartilhamento e reuso dos dados que sustentam as análises, resultados, discussões e conclusões descritas nos manuscritos. Cabe destacar ainda, que a publicação destes dados de pesquisa contribui para o aumento da transparência no processo de avaliação por pares, facilitando, também, a reprodução e replicação das pesquisas.

Desde janeiro de 2021, o projeto SciELO promoveu o aperfeiçoamento de um grupo técnico em gestão de dados de pesquisa e sua operação no sistema Dataverse que é responsável pelo desenvolvimento do SciELO Data. O grupo elaborou e mantém atualizada extensa documentação de apoio à operação, que pode ser consultada em português, inglês e espanhol na página do SciELO Data no portal da Rede SciELO.5 Responsável pela assistência técnica aos autores, periódicos e coordenações da rede SciELO, o grupo pode ser contatado pelo e-mail <data@scielo.org>.

Notas

1. SciELO – modelo de publicação eletrônica para países em desenvolvimento [online]. SciELO.org. 2019 [viewed 24 August 2022]. Available from: https://wp.scielo.org/wp-content/uploads/Modelo_SciELO.pdf

2. Guia de preparação de dados de pesquisa [online]. SciELO.org. 2022 [viewed 24 August 2022]. Available from: https://wp.scielo.org/wp-content/uploads/Guia_preparacao_pt.pdf

3. Guia de depósito de dados de pesquisa [online]. SciELO.org. 2022 [viewed 24 August 2022]. Available from: https://wp.scielo.org/wp-content/uploads/Guia_deposito_pt.pdf

4. Guia de curadoria de dados de pesquisa para equipes editoriais [online]. SciELO.org. 2022 [viewed 24 August 2022]. Available from: https://wp.scielo.org/wp-content/uploads/Guia_curadoria_pt.pdf

5. SciELO Data | SciELO.org: https://scielo.org/pt/sobre-o-scielo/scielo-data-pt/

Referências

Guia de curadoria de dados de pesquisa para equipes editoriais [online]. SciELO.org. 2022 [viewed 24 August 2022]. Available from: https://wp.scielo.org/wp-content/uploads/Guia_curadoria_pt.pdf

Guia de depósito de dados de pesquisa [online]. SciELO.org. 2022 [viewed 24 August 2022]. Available from: https://wp.scielo.org/wp-content/uploads/Guia_deposito_pt.pdf

Guia de preparação de dados de pesquisa [online]. SciELO.org. 2022 [viewed 24 August 2022]. Available from: https://wp.scielo.org/wp-content/uploads/Guia_preparacao_pt.pdf

Lançamento do repositório SciELO Data [online]. MailChimp. 2020 [viewed 24 August 2022]. Available from: https://mailchi.mp/scielo/scielo-data-pt

SciELO – modelo de publicação eletrônica para países em desenvolvimento [online]. SciELO.org. 2019 [viewed 24 August 2022]. Available from: https://wp.scielo.org/wp-content/uploads/Modelo_SciELO.pdf

Links externos

DataCite Repository Selector: https://repositoryfinder.datacite.org/search?query=scielo%20data&sort=relevance

Dataset Search: https://datasetsearch.research.google.com/

FAIRsharing | SciELO Data: https://fairsharing.org/3575

Google: https://www.google.com/

Metrics | The Dataverse Project: https://dataverse.org/metrics

Ranking Web of Repositories: https://repositories.webometrics.info/en

SciELO Data | r3data.org: https://www.re3data.org/repository/r3d100013658

SciELO Data | SciELO.org: https://scielo.org/pt/sobre-o-scielo/scielo-data-pt/

SciELO Data: https://data.scielo.org/

SciELO Preprints: https://preprints.scielo.org/index.php/scielo

The Dataverse Project: https://dataverse.org/

 

Como citar este post [ISO 690/2010]:

SANTOS, S., TANIGUSHI, C, and PACKER, A.L. O repositório de dados SciELO Data em operação regular [online]. SciELO em Perspectiva, 2022 [viewed ]. Available from: https://blog.scielo.org/blog/2022/08/24/o-repositorio-de-dados-scielo-data-em-operacao-regular/

 

Leave a Reply

Your email address will not be published.

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Post Navigation