El intercambio en acceso abierto de los datos de investigación legibles por máquina (machine-readable data) está atrayendo la atención de la comunidad académica, de las agencias de financiación, de las empresas y de la sociedad civil desde 2013, año en que fue publicado un informe sobre su impacto científico potencial, financiero y para el sector productivo.
Desde entonces, han habido avances significativos en las discusiones sobre las cuestiones tecnológicas, metodológicas, éticas y prácticas del intercambio de datos. Una revista científica de acceso abierto y arbitrada por pares – Scientific Data – fue lanzada por el Nature Publishing Group (NPG) para publicar exclusivamente conjuntos de datos (datasets) de investigación. Un artículo reciente publicado en esta revista se refiere a la iniciativa Making Data Count1, que tiene como objetivo promover el intercambio de datos y – principalmente – su reconocimiento como producción científica pasible de ser citada, así como obtener métricas de impacto científico de estos datos.
Una de las vías para incentivar la producción y publicación de datos es el establecimiento de métricas para evaluar su significado e impacto, dado que el impacto constituye la moneda del mundo académico. La academia usa tradicionalmente métricas basadas en citaciones, sin embargo, más recientemente, las métricas alternativas basadas en las referencias a los artículos en los medios sociales (‘altmetrics’) proveen evaluaciones en el corto plazo después de la publicación, además de diversificar las formas de medir el impacto. Varios grupos están realizando estudios sobre métricas tradicionales, alternativas e innovadoras para los datos de investigación.
Making Data Count es el resultado de la colaboración entre California Digital Library (CDL), la Public Library of Science (PloS) y la Data Observation Network for Earth (DataONE), que apunta no solamente a definir, sino también implementar un conjunto de métricas para datos de investigación. La homepage de la iniciativa afirma “El intercambio de datos es lento y los investigadores precisan incentivos para hacer el trabajo extra. Las métricas de datos suministrarán el feedback sobre el uso, visualización e impacto de los datos, que ayudarán a incentivar a los científicos a compartir sus datos. Este proyecto explorará y probará las métricas (métricas a nivel de datos) para recoger datos relacionados con la investigación.”
La creación de Making Data Count fue precedida de una investigación online realizada en noviembre y diciembre de 2014, de la cual participaron 247 investigadores y 73 administradores de repositorios. La mayoría de los investigadores (78%) pertenecía a instituciones académicas localizadas en los EUA (57%) y Reino Unido (14%). Entre los administradores, 64% eran de repositorios académicos y 22% de repositorios administrados por gobiernos en los EUA (72%) y el Reino Unido (11%).
Las preguntas planteadas incluían la proporción de datos compartidos por los autores, dónde buscar datos públicos para reutilización, la frecuencia del uso de datos de otros autores, comportamiento frente a la información de quien reutiliza sus datos, interés en el impacto de los datos propios, y cuáles métricas usan/ofrecen los repositorios que almacenan sus datos.
En cuanto a la forma de compartir datos, los investigadores informaron que con frecuencia atienden solicitudes personales, vía e-mail, por ejemplo. Las desventajas de esta práctica van desde la posible negativa a atener el pedido a la imposibilidad de medir el impacto de su utilización. Felizmente, 75% de los entrevistados informaron que comparten parte de sus datos a través de repositorios creados específicamente para esta finalidad.
En lo que se refiere a búsqueda de datos para reutilización, la mayoría de los entrevistados informó que realizan búsquedas en varias fuentes, incluyendo artículos de revistas, bases de datos, buscadores de Internet, medios sociales y foros de discusión dentro de sus comunidades.
Los datos abiertos son usados con cierta frecuencia en alguna etapa del proceso de desarrollo de un proyecto de investigación según el 96% de los encuestados. Los datos son usados por los investigadores en extensión comparable en las varias etapas de la investigación, y el 70% informa que los usa para llegar a la conclusión principal. Estos hechos destacan la importancia de los datos abiertos en la forma como se realiza actualmente la investigación.
Los investigadores que comparten sus datos abiertos tienen interés en saber quién los usa y para qué finalidad. Los repositorios satisfacen parte de este interés; cerca de la mitad solicita información de contacto detallada (nombre, institución e e-mail) mientras que la otra mitad no solicita ninguna información. En cuanto a la disponibilidad de los datos relacionados con la confidencialidad, los repositorios requieren de los usuarios identificación detallada, mientras que el acceso facilitado a los datos los hace más propensos a ser usados. Como solución de compromiso, los repositorios pueden solicitar a los usuarios el área de conocimientos en la que pretenden usar los datos abiertos, lo que permite que los administradores sepan dónde están siendo usados los datos y al mismo tiempo preservan la confidencialidad de los usuarios.
Las métricas a nivel de datos abiertos interesan potencialmente a los administradores, agencias de financiación y a los investigadores que generaron los datos. La mayoría de los investigadores (85%) y administradores de repositorios (61%) entrevistados destacan las citaciones como la métrica de mayor prestigio, seguida por las medidas de descargas, y por último, visualizaciones, lo que es consistente con lo que se observa con las métricas de artículos y revistas. Por último, los administradores informaron cuáles métricas monitorean y ofrecen sus repositorios. La casi totalidad monitorea descargas y la mayoría las visualizaciones, sin embargo menos de la mitad muestra estos resultados. Un pequeño porcentaje (cerca del 20%) monitorea las citaciones a conjuntos de datos individuales o a repositorios, de manera general, a pesar de su prestigio, presumiblemente por la dificultad de obtenerlos.
Los investigadores, principalmente los académicos, valoran las citaciones, a pesar de que su utilidad para los datos abiertos es limitada, dado que los datasets raramente son citados. La mayoría de ellos, sin embargo, considera que la “citación formal sería una condición justa para el intercambio de datos”1.
La cuestión compleja del crédito de los datos de investigación fue reunida recientemente en el documento Joint Declaration of Data Citation Principles (DC1), elaborado por el grupo internacional FORCE11 y anteriormente informado en este blog2. Hasta el momento la Declaración fue firmada por 94 repositorios, editoriales e instituciones académicas de prestigio. Considerando los principios del DC1, la iniciativa Making Data Count recomienda que se incentive la citación formal de los datos abiertos, y además de la recolección también hacer disponibles las medidas de descargas, más fáciles de obtener y ofrecer, y que gozan de clara reputación entre los investigadores. Por último, pero no menos importante, es la contabilización de las métricas a nivel de artículo y métricas alternativas basadas en bookmarks y medios sociales como Mendeley, CiteULike, Facebook, Twitter y otras.
Se espera, de esta manera, que cuantificar el impacto de los datos abiertos para aumentar su disponibilidad y uso por los investigadores, sea atendida por iniciativas como Making Data Count, y otras por venir.
Notas
1. KRATZ, J. E. and STRASSER, C. Making data count. Scientific Data. 2015, nº150039 [online]. DOI: http://dx..org/10.1038/sdata.2015.39
2. SPINAK, E. Principios para citar datos científicos. SciELO en Perspectiva. [viewed18 September 2015]. Available from: http://blog.scielo.org/es/2015/01/15/principios-para-citar-datos-cientificos/
Referencias
Dataset Level Metrics Subject Group. Consortia Advancing Standards in Research Administration Information (CASRAI). Available from: http://casrai.org/standards/subject-groups/dataset-level-metrics
KRATZ, J. E. and STRASSER, C. Making data count. Scientific Data. 2015, nº150039 [online]. DOI: http://dx..org/10.1038/sdata.2015.39
MARTONE, M. Joint Declaration of Data Citation Principles. FORCE11, Data Citation Synthesis Group, 2014. Available from https://www.force11.org/group/joint-declaration-data-citation-principles-final
NISO Alternative Assessment Metrics (Altmetrics) Initiative. National Information Standards Organization (NISO). Available from: http://www.niso.org/topics/tl/altmetrics_initiative/
RDA/WDS Publishing Data Bibliometrics WG Case Statement. Research Data Alliance. Available from: http://rd-alliance.org/group/rdawds-publishing-data-bibliometrics-wg/case-statement/rdawds-publishing-data-bibliometrics-wg
SCIENTIFIC ELECTRONIC LIBRARY ONLINE. El Movimiento Open Data se consolida internacionalmente. SciELO en Perspectiva. [viewed 18 September 2015]. Available from: http://blog.scielo.org/es/2014/07/14/el-movimiento-open-data-se-consolida-internacionalmente/
SPINAK, E. and PACKER, A. Scientific Data: Nature Publishing Group avanza la comunicación de datos científicos con nueva publicación online en acceso abierto. SciELO en Perspectiva. [viewed 18 September 2015]. Available from: http://blog.scielo.org/es/2014/02/04/scientific-data-nature-publishing-group-avanza-la-comunicacion-de-datos-cientificos-con-nueva-publicacion-online-en-acceso-abierto/
SPINAK, E. Datos Abiertos: información líquida, democracia, innovación… los tiempos se están cambiando. SciELO en Perspectiva. [viewed 18 September 2015]. Available from: http://blog.scielo.org/es/2013/11/18/datos-abiertos-informacion-liquida-democracia-innovacion-los-tiempos-se-estan-cambiando/
SPINAK, E. Intercambio de datos de investigación, siguen siendo bajos y aumentan lentamente. SciELO en Perspectiva. [viewed 18 September 2015]. Available from: http://blog.scielo.org/es/2014/11/12/intercambio-de-datos-de-investigacion-siguen-siendo-bajos-y-aumentan-lentamente/
SPINAK, E. Principios para citar datos científicos. SciELO en Perspectiva. [viewed 18 September 2015]. Available from: http://blog.scielo.org/es/2015/01/15/principios-para-citar-datos-cientificos/
SPINAK, E. Semana Internacional de los Datos Abiertos – ¿qué hay de nuevo?. SciELO en Perspectiva. [viewed 18 September 2015]. Available from: http://blog.scielo.org/es/2015/01/07/semana-internacional-de-los-datos-abiertos-que-hay-de-nuevo/
Enlaces externos
Altmetric – <http://www.altmetric.com/>
Making Data Count: Project to develop Data-Level Metrics – <http://mdc.lagotto.io/>
Scientific Data – <http://www.nature.com/sdata/>
Sobre Lilian Nassi-Calò
Lilian Nassi-Calò estudió química en el Instituto de Química de la USP, tiene un doctorado en Bioquímica por la misma institución y un pos doctorado como becaria de la Fundación Alexander von Humboldt en Wuerzburg, Alemania. Después de concluir sus estudios, fue docente e investigadora en el IQ-USP. Trabajó en la industria privada como química industrial y actualmente es Coordinadora de Comunicación Científica en BIREME/OPS/OMS y colaboradora de SciELO.
Traducido del original en portugués por Ernesto Spinak.
Como citar este post [ISO 690/2010]:
Lea el comentario en inglés, por Peter McGrath:
http://blog.scielo.org/en/2015/10/01/project-making-data-count-encourages-sharing-of-research-data/#comment-112353