Principios para citar datos científicos

Data Citation PrinciplesLas referencias bibliográficas a trabajos publicados son una práctica común y obligada en la literatura científica desde tiempos inmemoriales. Cada disciplina tiene definida sus normas de registro, y existen decenas de estilos editoriales de presentación tales como Vancouver, ISO 690, APA, Turabian, MLA, etc.

Pero, en los últimos años, gracias a la globalización de la publicación de revistas científicas electrónicas, y las posibilidades de comunicación e intercambio de información que permite Internet, comenzó a discutirse la necesidad e importancia de registrar y citar también las fuentes de datos (datasets) que sustentan los trabajos académicos. Para que la investigación cumpla con una de las premisas fundamentales de una ciencia sana y robusta, es que los resultados de una comunicación científica sean reproducibles, lo que hace necesario y conveniente que los datos de la investigación sean objetos citables y accesibles.

La buena práctica de la ciencia debe asumir que los datos forman parte de un ecosistema y que deben ser accesibles y reutilizables. En otras palabras, los trabajos científicos además de registrar las fuentes bibliográficas, deberían proporcionar también acceso a los datos originales que sustentan la investigación.

Tan temprano como en 2007, Micah Altman y Gary King hicieron una propuesta advirtiendo la necesidad de llegar a ese objetivo en un artículo publicado en D-lib Magazine1, iniciando un proceso que prontamente fue tomado por el International Council for Science: Committee on Data for Science and Technology (CODATA/ICSU), y aprobó esa iniciativa en su 27ª Asamblea General en Ciudad del Cabo, Sudáfrica en el año 20102. En la declaración indicaba varios aspectos importantes que reclamaban la atención a la comunidad científica internacional, entre los que destacamos:

  • Sin importar los diferentes formatos en que se registre la actividad científica (bases de datos planas, jerárquicas, relacionales, XML, etc.), se debe garantizar la interoperabilidad y facilitar la reutilización de los datos.
  • La necesidad de lograr estándares en los formatos de citación de los datos fuentes.
  • Crear normas para el registro de los metadatos que describen los conjuntos de datos (datasets).
  • Debido a que los datasets son esencialmente dinámicos (a diferencia de los documentos) es necesario garantizar que la práctica de citación incorpore el versionado de los datos, es decir, poder mantener la historia de cambios y agregados al conjunto de datos original.
  • Las diferentes disciplinas científicas requieren diferente granularidad de los objetos digitales que se registran como datos fuentes.
  • Informar los roles que cumplen las diferentes partes interesadas, es decir, los equipos de investigación, las agencias que financian, las universidades, etc.
  • Para garantizar la utilidad y persistencia a lo largo del tiempo, los costos de acceso y mantenimiento deben ser accesibles a todas las partes.
  • Preservar los mecanismos de protección intelectual, sea bajo Creative Commons así como las leyes tradicionales de copyright.

La declaración oficial del año 2010 fue luego enriquecida en varios trabajos que sirvieron como base para la recientemente aprobada Declaración Conjunta de los Principios de Citación de Datos (DC1)3, por el grupo de trabajo internacional FORCE11, constituido por una comunidad de investigadores, bibliotecarios, archivistas, editores y agencias de financiación de investigación científica, interesados en el futuro de la comunicación científica y la e-academia.

Esta declaración ya fue suscrita por más de 80 de las principales editoriales científicas, universidades e instituciones del mundo, entre las que destacamos Elsevier, PLOS, ORCID, Nature Publishing Group, Association of Research Libraries, BioMed Central, CrossRef, etc.

Los objetivos de la iniciativa es lograr que, una vez que se establezca la cultura de citación de los datos fuentes, comiencen a ser evidentes los beneficios, entre los que anotamos

  • La infraestructura editorial debe asegurar que las referencias electrónicas a los datos se mantengan en el futuro y puedan ser reutilizadas.
  • Los servicios de publicación electrónica deberán construir controles para que disminuya el peligro que investigadores “roben” datos ajenos (plagio de datos).
  • Podrá medirse el impacto tanto de los datasets como el de los creadores de esos datos.
  • Los investigadores podrán obtener reconocimiento profesional de la misma manera que se obtiene por las publicaciones tradicionales.

Mantener los datos en forma citable es una responsabilidad que deberá asumirse o bien por el editor científico, o el distribuidor, o los repositorios institucionales o archivos en donde se produce la investigación. En este contexto, ha de tenerse en cuenta los siguientes factores:

  • Los datasets deberán ser registrados con suficientes metadatos que expliquen el conjunto de datos y deberán también permanecer accesibles.
  • Se recomienda una estrategia de identificador persistente del tipo DOI.

Los ocho principios directores aprobados en la reciente declaración DC1 cubren los propósitos, funciones y atributos de las citaciones, y reconocen la necesidad de crear prácticas que sean comprensibles tanto a los humanos como a las máquinas.

Estos principios son: (1) Importancia; (2) Crédito y atribución; (3) Evidencia; (4) Identificación única; (5) Acceso; (6) Persistencia; (7) Especificidad y Verificabilidad; (8) Interoperabilidad y Flexibilidad.

Puede verlos en detalle en el sitio del FORCE113.

Conclusión

Como ya se dijo más arriba en este post, los beneficios de la citación de datos de investigación a la comunidad científica incluyen:

  • Incorporar al paradigma de la ciencia el concepto de que los datos de investigación son una contribución legítimamente citable.
  • Los resultados podrán ser verificados por terceros, facilitarán la replicación de los experimentos y reutilizarse para estudios futuros.
  • Podrán evaluarse métricas de uso y generar créditos de la misma manera que se hace con las publicaciones convencionales.

Está en los planes de SciELO adoptar los Principios de Citación de Datos en el futuro como parte del proceso de gestión de los resultados de investigación.

Si su institución desea apoyar esta iniciativa, puede registrarse en: http://www.force11.org/datacitation/endorsements

Hay una presentación muy didáctica y completa en Slideshare que recomendamos: Joint Declaration of Data Citation Principles (Overview)4

Notas

1 ALTMAN, M. A Proposed Standard for the Scholarly Citation of Quantitative Data. D-Lib Magazine. 2007, vol. 13, nº 3-4. ISSN 1082-9873. Available from: http://www.dlib.org/dlib/march07/altman/03altman.html

2 Data Citation Standards and Practices: The need for robust data citation capabilities. CODATA/ICSU. 2010. Available from: http://www.codata.org/task-groups/data-citation-standards-and-practices

3 Joint Declaration of Data Citation Principles. FORCE11. 2014. Available from: http://www.force11.org/datacitation

4 The Data Citation Synthesis Group. “Joint data citation principles slide set v2”. In: Joint Declaration of Data Citation Principles (Overview). 17 slides. Available from: http://www.slideshare.net/force11/joint-data-citation-principles-slide-set-v2

Referencias

BALL, A., DUKE, M. Data Citation and Linking. DCC Briefing Papers. Edinburgh: Digital Curation Centre, 2012. Available from: http://www.dcc.ac.uk/resources/briefing-papers/introduction-curation/data-citation-and-linking

CODATA/ITSCI Task Force on Data Citation. Out of cite, out of mind: The Current State of Practice, Policy and Technology for Data Citation. Data Science Journal. 2013, vol. 12, nº 1-75. DOI: 10.2481/dsj.OSOM13-043. Available from: http://www.jstage.jst.go.jp/article/dsj/12/0/12_OSOM13-043/_pdf

Data citation endorsements. FORCE11. 2014. [viewed September 20th 2014] Available from: https://www.force11.org/datacitation/endorsements

Enlaces externos

CODATA/ICSU – <http://www.codata.org>

FORCE11 – <https://www.force11.org>

 

Ernesto SpinakSobre Ernesto Spinak

Colaborador do SciELO, Ingeniero en Sistemas y Lic. en Biblioteconomía, con Diploma de Estudios Avanzados pela Universitat Oberta de Catalunya y Maestría en “Sociedad de la Información” por la Universidad Oberta de Catalunya, Barcelona – España. Actualmente tiene una empresa de consultoría que atiende a 14 instituciones de gobierno y universidades en Uruguay con proyectos de información.

author avatar
Ernesto Spinak
Colaborador do SciELO, engenheiro de Sistemas e licenciado en Biblioteconomia, com diploma de Estudos Avançados pela Universitat Oberta de Catalunya e Mestre em “Sociedad de la Información" pela Universidad Oberta de Catalunya, Barcelona – Espanha. Atualmente tem uma empresa de consultoria que atende a 14 instituições do governo e universidades do Uruguai com projetos de informação.

 

Como citar este post [ISO 690/2010]:

SPINAK, E. Principios para citar datos científicos [online]. SciELO en Perspectiva, 2015 [viewed ]. Available from: https://blog.scielo.org/es/2015/01/15/principios-para-citar-datos-cientificos/

 

One Thought on “Principios para citar datos científicos

  1. Pingback: Principios para citar datos científicos | La biblioteca informa

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Post Navigation