El repositorio de datos SciELO Data en funcionamiento regular

Por Solange Santos, Carolina Tanigushi y Abel L Packer

Logo de SciELO Data

El tercer ciclo de desarrollo del Programa SciELO prevé su posicionamiento como un programa de ciencia abierta. En este sentido, el Programa SciELO pasa a incorporar formalmente prácticas de Ciencia Abierta en sus principios y en la formulación de la estrategia, objetivos, funciones y planes de trabajo del Modelo SciELO de Publicación1 (texto disponible solo en portugués).

En este nuevo modus operandi, corresponde a cada revista renovar su política y gestión editorial a favor de aceptar manuscritos depositados en servidores de preprint confiables, citar, referenciar y compartir contenidos subyacentes a los textos de los artículos y ofrecer opciones que promuevan una mayor transparencia y calidad en el proceso de revisión por pares.

En agosto de 2020, el repositorio de datos SciELO Data fue lanzado y operado experimentalmente hasta enero de 2022. SciELO Data tiene un alcance multidisciplinario y opera el depósito, preservación y difusión de datos de investigación de artículos enviados, aprobados para publicación o ya publicados en revistas de la Red SciELO o publicados en SciELO Preprints. Los datos de investigación son operados en forma de archivos digitales de datos numéricos, códigos de aplicaciones informáticas, textos, esquemas y otros contenidos subyacentes a los textos de los artículos.

SciELO Data utiliza la plataforma de código abierto Dataverse, desarrollada por el Instituto de Ciencias Sociales Cuantitativas (IQSS) de la Universidad de Harvard. A junio de 2022, hay 79 repositorios de datos que funcionan con Dataverse repartidos por todo el mundo.

Un repositorio de dataverse permite hospedar recursivamente múltiples colecciones o repositorios dataverse. En el contexto de SciELO Data, cada revista tiene su propio dataverse, al igual que el servidor SciELO Preprints. Eventualmente, puede tener más de un dataverse. Las revistas son responsables de administrar sus dataverses con el apoyo del equipo SciELO, lo que permite que el intercambio de datos de investigación se realice de acuerdo con las políticas editoriales de cada revista y las especificidades de las comunidades de investigación.

Los dataverses están formados por conjuntos de archivos de datos o conjuntos de datos (datasets). Cada conjunto y cada uno de sus archivos va siempre acompañado de metadatos. De esta forma, además de almacenar, preservar y publicar datos de investigación, las revistas SciELO aumentarán la visibilidad de la investigación al compartir, citar, explorar y analizar datos de investigación.

Diagrama que muestra los niveles de la colección del dataverse SciELO Data. La colección de dataverse de SciELO Data abarca los dataverse de las revistas que contienen los conjuntos de datos.

En este contexto, el flujo de trabajo de SciELO Data se desarrolla de la siguiente manera:

  1. Los investigadores preparan el conjunto de datos durante su investigación (archivos de datos numéricos en diferentes formatos, códigos de aplicaciones informáticas, documentos, esquemas, audios, videos, etc.) siguiendo la Guía de preparación de datos de investigación;2
  2. El depósito del conjunto de datos en el dataverse de la revista en SciELO Data se realiza siguiendo la Guía de depósito de datos de investigación;3
  3. Los investigadores envían el conjunto de datos al equipo editorial de la revista para su curaduría;
  4. La revista recibe notificación de SciELO Data informando sobre el depósito de un conjunto de datos;
  5. La revista conserva el conjunto de datos de acuerdo con las instrucciones de la Guía de curación de datos de investigación para equipos editoriales;4
  6. Una vez que el conjunto de datos cumple con los estándares establecidos, la revista informa al equipo SciELO Data que el conjunto de datos ya está disponible para su curaduría por parte del equipo SciELO;
  7. El equipo de SciELO Data revisa el conjunto de datos;
  8. SciELO informa a la redacción de la revista que la revisión ha concluido; y,
  9. El equipo editorial decide sobre la publicación del conjunto de datos.

Diagrama de flujo de SciELO Data

Al promover la visibilidad de la investigación, el contenido del repositorio SciELO Data es indexado y recuperado por algunos de los servicios de indexación y búsqueda de datos más importantes, como: Google, Dataset Search, Re3Data, FAIRSharing, Repository Finder y Ranking web of repositories.

La adopción de prácticas de ciencia abierta en su conjunto supone la revisión y enriquecimiento de metodologías, conceptos y desafíos para agregar nuevas funcionalidades, que muchas veces se perciben como disruptivas para la comunicación científica.

En este sentido, uno de los mayores desafíos para la consolidación de SciELO Data está precisamente en las dificultades y resistencias de los investigadores para avanzar en el intercambio de datos de sus investigaciones y de las revistas en la actualización de sus políticas editoriales para transformar el intercambio de datos como una práctica integrada en el proceso editorial. A esto se suma el tiempo y la energía necesarios para aprender e implementar estos cambios, que demandan de los diferentes actores (autores, revisores, editores, equipos editoriales) una nueva actuación alineada con el modus operandi de la Ciencia Abierta.

Como repositorio confiable de datos, SciELO Data tiene, además de la preservación a largo plazo de los datos de investigación, el papel de facilitador en el intercambio y reutilización de datos que sustentan los análisis, resultados, discusiones y conclusiones descritas en los manuscritos. También vale la pena señalar que la publicación de estos datos de investigación contribuye a aumentar la transparencia en el proceso de revisión por pares, y también facilita la reproducción y replicación de la investigación.

Desde enero de 2021, el proyecto SciELO promueve la mejora de un grupo técnico en gestión de datos de investigación y su funcionamiento en el sistema Dataverse, que es responsable del desarrollo de SciELO Data. El grupo elaboró y mantiene actualizada una extensa documentación de apoyo a la operación, que puede ser consultada en portugués, inglés y español en la página SciELO Data del portal de la Red SciELO.5 Responsable de la asistencia técnica a los autores, revistas y coordinadores de la red SciELO, el grupo puede ser contactado por correo electrónico <data@scielo.org>.

Notas

1. SciELO – modelo de publicação eletrônica para países em desenvolvimento [online]. SciELO.org. 2019 [viewed 24 August 2022]. Available from: https://wp.scielo.org/wp-content/uploads/Modelo_SciELO.pdf

2. Guía de preparación de datos de investigación [online]. SciELO.org. 2022 [viewed 24 August 2022]. Available from: https://wp.scielo.org/wp-content/uploads/Guia_preparacao_es.pdf

3. Guía de depósito de datos de investigación [online]. SciELO.org. 2022 [viewed 24 August 2022]. Available from: https://wp.scielo.org/wp-content/uploads/Guia_deposito_es.pdf

4. Guía de curación de datos de investigación para equipos editoriales [online]. SciELO.org. 2022 [viewed 24 August 2022]. Available from: https://wp.scielo.org/wp-content/uploads/Guia_curadoria_es.pdf

5. SciELO Data | SciELO.org: https://scielo.org/es/sobre-el-scielo/scielo-data-es/

Referencias

Guía de curación de datos de investigación para equipos editoriales [online]. SciELO.org. 2022 [viewed 24 August 2022]. Available from: https://wp.scielo.org/wp-content/uploads/Guia_curadoria_es.pdf

Guía de depósito de datos de investigación [online]. SciELO.org. 2022 [viewed 24 August 2022]. Available from: https://wp.scielo.org/wp-content/uploads/Guia_deposito_es.pdf

Guía de preparación de datos de investigación [online]. SciELO.org. 2022 [viewed 24 August 2022]. Available from: https://wp.scielo.org/wp-content/uploads/Guia_preparacao_es.pdf

Lanzamiento del repositorio SciELO Data [online]. MailChimp. 2020 [viewed 24 August 2022]. Available from: http://eepurl.com/hbkCTn

SciELO – modelo de publicação eletrônica para países em desenvolvimento [online]. SciELO.org. 2019 [viewed 24 August 2022]. Available from: https://wp.scielo.org/wp-content/uploads/Modelo_SciELO.pdf

Enlaces externos

DataCite Repository Selector: https://repositoryfinder.datacite.org/search?query=scielo%20data&sort=relevance

Dataset Search: https://datasetsearch.research.google.com/

FAIRsharing | SciELO Data: https://fairsharing.org/3575

Google: https://www.google.com/

Metrics | The Dataverse Project: https://dataverse.org/metrics

Ranking Web of Repositories: https://repositories.webometrics.info/en

SciELO Data | r3data.org: https://www.re3data.org/repository/r3d100013658

SciELO Data | SciELO.org: https://scielo.org/es/sobre-el-scielo/scielo-data-es/

SciELO Data: https://data.scielo.org/

SciELO Preprints: https://preprints.scielo.org/index.php/scielo

The Dataverse Project: https://dataverse.org/

 

Traducido del original en portugués por Ernesto Spinak.

 

Como citar este post [ISO 690/2010]:

SANTOS, S., TANIGUSHI, C, and PACKER, A.L. El repositorio de datos SciELO Data en funcionamiento regular [online]. SciELO en Perspectiva, 2022 [viewed ]. Available from: https://blog.scielo.org/es/2022/08/24/el-repositorio-de-datos-scielo-data-en-funcionamiento-regular/

 

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Post Navigation