Documentos de datos… y FAIR [Publicado originalmente en el blog The road to FAIR en junio/2022]

Por Karla Avanço

Definición de documentos de datos

En el artículo Data Papers as a New Form of Knowledge Organization in the Field of Research Data, Schöpfel, et al.1 definen el documento de datos como documentos de metadatos buscables cuyo objetivo principal es describir un conjunto de datos, incluidas las condiciones y el contexto de su adquisición y su utilidad potencial. Los autores afirman que los artículos de datos se centran en la información sobre qué, dónde, cómo y quién de los datos en lugar de centrarse en los resultados originales de la investigación. Son artículos completos publicados en forma de artículos revisados por pares.

En el paradigma de investigación clásico, como explican los autores, existe una clara distinción entre conjuntos de datos (resultados de investigación), artículos (análisis y discusión de tales hallazgos) y resúmenes/indexación (la descripción de dichos conjuntos de datos y artículos). En este marco tradicional, la atención se centra en los artículos que presentan los hallazgos, mientras que los datos de la investigación son útiles para la validación de dichos hallazgos.

La inclusión del documento de datos en el entorno de publicación académica representa un cambio en la organización del conocimiento, desdibujando los límites y cambiando las prioridades a medida que el documento de datos interrelaciona conjuntos de datos, artículos y metadatos. Por lo tanto, el documento es útil para “informar y vincular datos de investigación en repositorios de datos, contribuyendo a su localización y reutilización.”1

Documentos de datos y ciencias sociales y humanidades

Los data papers son una forma de publicación que ha surgido en campos acostumbrados a presentar datos y hacerlos interpretables y verificables; sin embargo, en las ciencias sociales y humanidades (CSH) todavía tropezamos con la pregunta (recurrente): ¿cómo se ven los datos de investigación, ya que en este campo pueden tomar tantas formas diferentes?

En el artículo Poétique et Ingénierie Des Data Papers, Kembellec e Le Deuff2 se hicieron otras preguntas, como: ¿cómo llegó este objeto de las llamadas ciencias “duras” al umbral de nuestras prácticas en ciencias sociales y humanidades? ¿Podemos comparar los métodos de descripción de los corpus a partir de datos generados con los datos recolectados y filtrados pacientemente?

Esta última pregunta nos lleva a las posibles diferencias que podemos encontrar entre los data papers de CSH y los de las disciplinas STEM (Ciencia, Tecnología, Ingeniería y Matemáticas). Al respecto, Kembellec y Le Deuff2 firman que el data paper no puede ser un espacio científico de debate o presentación detallada de resultados de investigación. Según los autores,

[e]n STEM, un artículo de datos es un artículo científico descriptivo corto, de no más de 10 páginas en el caso de datos en breve: por lo tanto, no es un espacio de postura epistémica. (…) En las ciencias sociales y humanidades, el data paper es un concepto emergente (…). Lo consideramos sobre todo como un escrito de acompañamiento. Utiliza los códigos del papel de datos en STEM, respetando la tradición literaria. El documento de datos acompaña al conjunto de datos presentado y, en cierta medida, al proyecto asociado con él. 2

Data papers y Principios FAIR

A través de la descripción de metadatos enriquecidos, el objetivo principal del documento de datos es aumentar la capacidad de encontrar y reutilizar los conjuntos de datos. En el artículo Un Data Paper En SHS : Pourquoi, Pour Qui, Comment?, Gay3 explica que documentar el proceso de producción de datos y garantizar que se ajuste a los principios FAIR requiere mucho tiempo y, sin embargo, es necesario para la reproducibilidad de la investigación.

En este contexto, el documento de datos es una herramienta que puede permitir que los productores de datos vean reconocida su contribución científica al hacer que sus datos sean fácilmente citables, pero también al mejorar la relevancia y el alcance de la reutilización de sus datos.3

La mayoría de las revistas de datos son un producto puro de este nuevo ecosistema de acceso abierto, datos abiertos (y big data) y nuevas formas de selección y difusión, lo que las diferencia de otras revistas académicas, lo que las hace especialmente interesantes para los requisitos de los Principios FAIR. Schöpfel, et al.1 detallaron cómo los documentos de datos contribuyen al cumplimiento de los principios FAIR de diferentes maneras.

Localizable (findable)
F2. Los datos se describen con metadatos enriquecidos Los documentos de datos enriquecen los metadatos existentes de los conjuntos de datos.
F4. Los (meta)datos se registran o indexan en un recurso de búsqueda Los metadatos enriquecidos se registran, indexan y conservan en la plataforma del diario de datos.
Accesible (accessible)
A2. Los metadatos son accesibles, incluso cuando los datos ya no están disponibles La accesibilidad de los metadatos publicados a través de documentos de datos no depende de la accesibilidad de los conjuntos de datos en un repositorio de datos.
Interoperable (interoperable)
I1. Los (meta)datos utilizan un lenguaje formal, accesible, compartido y ampliamente aplicable para la representación del conocimiento Al menos algunas de las revistas de datos insisten en la aplicación de un lenguaje estándar y formal (vocabularios) para la descripción de los conjuntos de datos. Como mínimo, reproducen la representación formal del conjunto de datos de los repositorios de datos.
I3. Los (meta)datos incluyen referencias calificadas a otros (meta)datos Los documentos de datos pueden (y generalmente lo hacen) proporcionar enlaces a otros recursos relacionados, p.ej. trabajos de investigación, afiliaciones institucionales, conjuntos de datos similares o relacionados, etc.
Reutilizable (reusable)
R1.1. Los (meta)datos se publican con una licencia de uso de datos clara y accesible La mayoría de los documentos de datos se publican con una licencia abierta; siempre que el documento de datos se derive de los metadatos originales, esta licencia puede depender de los derechos de licencia y reutilización iniciales del repositorio.
R1.2. Los (meta)datos están asociados con una procedencia detallada Una de las principales funciones de los documentos de datos es proporcionar un conocimiento detallado sobre el origen de los datos, a quién citar, quién los generó o recopiló y cómo se han recopilado.

Adaptado de Schöpfel, et al.1

 

Serie de videos

Para obtener más información sobre la nueva forma de publicación en CSH, The road to FAIR recomienda una serie de tres videos coproducidos por EOSC-Pillar, en el marco del Paquete de Trabajo dedicado a establecer servicios de FAIR Data, en colaboración con CNRS, Centre National de la Recherche Scientifique, (Huma-Num) y CO-OPERAS IN (OpenEdition).

Los videos se basan en entrevistas con profesores franceses, investigadores, editores de revistas y se centran en la definición de papel de datos, su ecosistema y su impacto.

Además de definir los documentos de datos, el primer video de la serie analiza la estructura de este tipo de documentos, los criterios para su evaluación, la importancia del plan de gestión de datos y las formas de hacerlo FAIR.

 

El segundo video se enfoca en el ecosistema de los documentos de datos y algunos de sus elementos constitutivos (herramientas, repositorios de datos, diarios de datos) y los obstáculos para la producción de documentos de datos.

El video final trata sobre el impacto de los documentos de datos: compartir datos y métodos, funcionar como una herramienta educativa, aumentar las citas, la descarga de datos y las posibilidades de colaboración.

Notas

1. SCHÖPFEL, J., et al. Data Papers as a New Form of Knowledge Organization in the Field of Research Data. Knowledge Organization [online]. 2020, vol. 46, no. 8, pp. 622–38. https://doi.org/10.5771/0943-7444-2019-8-622. Available from: https://www.nomos-elibrary.de/10.5771/0943-7444-2019-8-622/data-papers-as-a-new-form-of-knowledge-organization-in-the-field-of-research-data-jahrgang-46-2019-heft-8?page=1

KEMBELLEC, G. and LE DEUFF, O. Poétique et Ingénierie Des Data Papers. Revue Française Des Sciences de l’information et de La Communication [online]. 2022, no. 24 [viewed 24 June 2022]. https://doi.org/10.4000/rfsic.12938. Available from: https://journals.openedition.org/rfsic/12938

GAY, V. Un Data Paper En SHS : Pourquoi, Pour Qui, Comment? In: #dhnord2021 – Publier, Partager, Réutiliser Les Données de La Recherche: Les Data Papers et Leurs Enjeux. Lille, 2021 [viewed 24 June 2022]. Available from: https://hal.archives-ouvertes.fr/hal-03434216

Referencias

GAY, V. Un Data Paper En SHS : Pourquoi, Pour Qui, Comment? In: #dhnord2021 – Publier, Partager, Réutiliser Les Données de La Recherche: Les Data Papers et Leurs Enjeux. Lille, 2021 [viewed 24 June 2022]. Available from: https://hal.archives-ouvertes.fr/hal-03434216

KEMBELLEC, G. and LE DEUFF, O. Poétique et Ingénierie Des Data Papers. Revue Française Des Sciences de l’information et de La Communication [online]. 2022, no. 24 [viewed 24 June 2022]. https://doi.org/10.4000/rfsic.12938. Available from: https://journals.openedition.org/rfsic/12938

SCHÖPFEL, J., et al. Data Papers as a New Form of Knowledge Organization in the Field of Research Data. Knowledge Organization [online]. 2020, vol. 46, no. 8, pp. 622–38. https://doi.org/10.5771/0943-7444-2019-8-622. Available from: https://www.nomos-elibrary.de/10.5771/0943-7444-2019-8-622/data-papers-as-a-new-form-of-knowledge-organization-in-the-field-of-research-data-jahrgang-46-2019-heft-8?page=1

 

Artículo original en inglés

Data papers… and FAIR

 

Traducido del original en inglés por Ernesto Spinak

 

Como citar este post [ISO 690/2010]:

AVANÇO, K. Documentos de datos… y FAIR [Publicado originalmente en el blog The road to FAIR en junio/2022] [online]. SciELO en Perspectiva, 2022 [viewed ]. Available from: https://blog.scielo.org/es/2022/06/24/documentos-de-datos-y-fair/

 

Leave a Reply

Your email address will not be published.

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Post Navigation