Administración de los datos de investigación en el CNRS de Francia

Por Ernesto Spinak

En la era de la Ciencia Abierta, la administración de los datos de investigación (RDM, research data management) es un desafío importante a tomar en cuenta en las políticas nacionales de investigación, porque los resultados suelen ser objetos complejos, dinámicos, difíciles de describir pero necesarios para validar los descubrimientos de las investigaciones. Estos datos son de tipos variados y complejos pues – para mencionar algunos – pueden ser secuencias del genoma, datos socio económicos, imágenes audiovisuales, bases estadísticas, aplicaciones de software, etc. En las nuevas estrategias de la comunidad europea hacia una ciencia abierta se incluyen (i) el acceso abierto, (ii) la cooperación en el intercambio de datos, y (iii) la administración de los datos bajo los principios de la iniciativa FAIR (Findable, Accessible, Interoperable and Reusable): “(…) todos los objetos de investigación deben ser encontrables, accesibles, interoperables y reutilizables, tanto para máquinas como para personas1.

Francia es uno de los estados miembros principales en la Unión Europea que lidera este esfuerzo, publicando decenas de miles de artículos científicos cada año y dedicando un porcentaje sustantivo del Producto Nacional Bruto en la investigación e innovación. El CNRS (Centre National de la Recherche Scientifique, Centro nacional de investigaciones científicas) es la organización pública de investigación más grande de Europa desarrollando investigaciones en todas las áreas del conocimiento a través de 10 instituciones con más de 32.500 investigadores en más de 1.000 laboratorios. Francia impulsa, junto con Holanda y Alemania, la iniciativa FAIR en Europa.

A los efectos de medir y evaluar las actitudes y comportamientos de la comunidad científica en Francia sobre el Acceso Abierto y el RDM, se llevó a cabo una encuesta entre julio y septiembre de 2014, enviando un cuestionario de más de 90 preguntas a los directores de 1.250 laboratorios del CRNS que representan todas las áreas de la ciencia básica en Francia. El objetivo fue comprender mejor los procesos de producción, administración y preservación de datos y, en particular, las actitudes de compartir los datos con otros científicos en términos de la cultura y principios FAIR. Los resultados2 fueron publicados recientemente y es el motivo de esta nota.

Las respuestas obtenidas de los directores de los 432 laboratorios que respondieron pueden dividirse en tres temas principales:

  • ¿Qué piensan los científicos acerca del intercambio de datos y la apertura? ¿Qué se puede decir de su cultura de datos abiertos?
  • ¿Hasta qué punto sus comportamientos y actitudes respecto a los datos apoyan los principios FAIR de RDM?
  • ¿Cuáles son las prioridades para RDM y qué tipo de servicios RDM solicitan los científicos?

Gestión de datos

El 61% de los directores declaró que la producción de datos de sus laboratorios necesita una RDM específica, pero solamente un tercio de ellos tiene algún tipo de herramienta para monitorear la producción, y menos aún ha establecido un plan de gestión de datos.

Recursos humanos entrenados

Aproximadamente un tercio de los laboratorios tiene personal específico a su disposición dedicado al RDM. La mayoría de ellos son empleados permanentes, pero más de la mitad de estas unidades también contrata personal por períodos limitados para hacer o ayudar a hacer el trabajo.

¿Cuál trabajo? Procesamiento de datos y creación de datos secundarios, producción de bases de datos; en menor grado curación de datos, incluyendo la producción de metadatos.

¿Qué tan bien están haciendo su trabajo? En general, el 75% de los gerentes sénior evalúan las habilidades RDM de su personal como básicas o buenas, pero solo un 8% como excelentes.

En cuatro dominios del RDM (referencia, seguridad de datos, ética y ley) el personal tiene habilidades que se consideran más altas, en comparación con la publicación de datos, donde casi el 40% de los directores considera que las habilidades del personal es insuficiente.

Compartir datos

El 40% de los directores de laboratorio declaran que sus datos de investigación se publican en línea, a menudo con restricciones de acceso (acceso a pedido, o limitado a usuarios autorizados); solo el 17% reporta que sus datos son difundidos libremente en la web, en acceso abierto.

El 59% de los encuestados confirma que sus laboratorios colaboran con otros científicos y unidades de investigación a través de herramientas de datos compartidos (84%), talleres (47%), directrices comunes (44%) y sesiones de capacitación (41%).

Disponibilidad

Más de la mitad de los directores de laboratorio en ciencias de la tierra y astronomía, informática, ciencias sociales, ecología y física nuclear declaran que sus datos están disponibles en línea. Pero este no es el caso, especialmente en otras tres disciplinas: química, física y matemáticas.

Sobre el intercambio de datos y publicaciones

La encuesta reveló que la mayoría de los encuestados (50-70%) apoya generalmente el acceso abierto y declara el uso real del repositorio nacional francés de HAL (Hyper Articles en Ligne), incluido el depósito de metadatos (registros) y documentos (texto completo), mientras que solo un pequeño grupo parece no estar interesado en la vía verde o la vía dorada, y son renuentes al autoarchivo y la publicación en acceso abierto.

Considerando los principios FAIR (encontrables, accesibles, interoperables y reutilizables), el informe que se comenta menciona que solo el 7% de los directores de laboratorio confirman que su práctica de administración de datos cumplen con estos cuatro criterios: publican datos en línea, permiten que al menos algunos de ellos estén libremente disponibles, aplican formatos de datos interoperables y utilizan estándares específicos de la comunidad. Otro 18% de los directores respondió afirmativamente a tres de las cuatro preguntas; 42% indicaron que cumplen con uno o dos criterios, pero el 32% respondió que “no” al cumplimiento de estas cuatro cuestiones. El “punto débil” más corriente parece ser la aplicación de formatos de datos interoperables, revelando además otros problemas como falta de infraestructura para interoperabilidad, capacidades y experiencia, incentivos y por encima de todo falta del desarrollo de políticas para su implementación.

Conclusiones preliminares

Cambiar las culturas de los científicos es un asunto complejo, como se revela en la encuesta del CNRS, un desafío que tiene que hacer frente a diferencias de valores y prácticas, herramientas y habilidades de los laboratorios e institutos, donde intervienen muchas partes interesadas, por ejemplo los científicos, los financiadores, técnicos, bibliotecarios, etc., con intereses diferentes y a veces opuestos.

Es importante establecer a nivel de cada institución y, como política general, guías de buenas prácticas, como por ejemplo los que se presentaron en la Semana SciELO 20 Años3.

Notas

1. Turning FAIR into reality: Final report and action plan from the European Commission expert group on FAIR data [online]. Publications Office of the EU. 2018 [viewed 16 January 2019]. Available from: https://publications.europa.eu/en/publication-detail/-/publication/7769a148-f1f6-11e8-9982-01aa75ed71a1/language-en/format-PDF/source-80611283

2. SCHÖPFEL, J., et al. Research data management in the French National Research Center (CNRS). Data Technologies and Applications [online]. 2018, vol. 52, no. 2, pp. 248-265 [viewed 16 January 2019]. Available from: https://hal.univ-lille3.fr/hal-01728541/

3. Documentos [online]. GT1 – El ayer, hoy y mañana de la Red SciELO – Reunión de la Red SciELO. 2018 [viewed 16 January 2019]. Available from: https://www.scielo20.org/redescielo/es/grupos-de-trabajo/gt1/#1522092702903-74c0a379-eca1

Referencias

Documentos [online]. GT1 – El ayer, hoy y mañana de la Red SciELO – Reunión de la Red SciELO. 2018 [viewed 16 January 2019]. Available from: https://www.scielo20.org/redescielo/es/grupos-de-trabajo/gt1/#1522092702903-74c0a379-eca1

SCHÖPFEL, J., et al. Research data management in the French National Research Center (CNRS). Data Technologies and Applications [online]. 2018, vol. 52, no. 2, pp. 248-265 [viewed 16 January 2019]. Available from: https://hal.univ-lille3.fr/hal-01728541/

Turning FAIR into reality: Final report and action plan from the European Commission expert group on FAIR data [online]. Publications Office of the EU. 2018 [viewed 16 January 2019]. Available from: https://publications.europa.eu/en/publication-detail/-/publication/7769a148-f1f6-11e8-9982-01aa75ed71a1/language-en/format-PDF/source-80611283

 

Sobre Ernesto Spinak

Colaborador do SciELO, Ingeniero en Sistemas y Lic. en Biblioteconomía, con Diploma de Estudios Avanzados pela Universitat Oberta de Catalunya y Maestría en “Sociedad de la Información” por la Universidad Oberta de Catalunya, Barcelona – España. Actualmente tiene una empresa de consultoría que atiende a 14 instituciones de gobierno y universidades en Uruguay con proyectos de información.

 

Como citar este post [ISO 690/2010]:

SPINAK, E. Administración de los datos de investigación en el CNRS de Francia [online]. SciELO en Perspectiva, 2019 [viewed ]. Available from: https://blog.scielo.org/es/2019/01/16/administracion-de-los-datos-de-investigacion-en-el-cnrs-de-francia/

 

5 Thoughts on “Administración de los datos de investigación en el CNRS de Francia

  1. Pingback: Administration of research data in France's CNRS | SciELO in Perspective

  2. Pingback: Administração dos dados de pesquisa no CNRS da França | SciELO em Perspectiva

  3. Juan A. on January 22, 2019 at 19:13 said:

    muy interesante el artículo

  4. Articulo muy rico

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Post Navigation