Los artículos de las revistas SciELO en las plataformas de Ciencia Abierta de la Comisión Europea

Por Abel L. Packer y Gustavo Fonseca

A partir de marzo de 2018 los artículos publicados por las revistas SciELO pasan a integrar y usufructuar las funcionalidades ofrecidas por dos proyectos importantes de desarrollo y operación de fuentes de gestión de información científica de acceso abierto de la Comisión Europea que son apoyadas por el programa Horizon 2020 de financiamiento de investigación desarrollo tecnológico e innovación. El primero es el repositorio OpenAire que incluye metadatos de publicaciones, datos de investigación, proyectos y organizaciones y sirve de referencia y apoyo a las políticas y mandatos europeos de acceso abierto, datos abiertos y alineados con las prácticas ciencia abierta. El segundo proyecto implementa el sistema OpenMinTeD (Open Mining Infrastructure for Text and Data) que comprende una infraestructura abierta de servicios orientada a la minería de textos y datos de investigación científica.

En marzo de 2018 el volumen de contenido abierto operado por OpenAire es notable en cantidad, que se expresa en la indexación y puesta a disposición para búsquedas de más de 23 millones registros bibliográficos de publicaciones científicas, de las cuales cerca de 14 millones son artículos de revistas. OpenAire indexa también más de 600 mil registros de datos de búsqueda. Estos contenidos se extraen a través de rastreadores web (web crawler) que visitan periódicamente más de 11 mil repositorios y revistas en acceso abierto, que se denominan “proveedores de datos” (data providers).

Los proveedores de datos deben cumplir los requisitos exigidos por OpenAire para exportar o poner a disposición sus contenidos según protocolos que permiten a los rastreadores de OpenAire realizar la extracción o recolección de metadatos de artículos y otros tipos de literatura científica, de datos de investigación, de documentos de proyectos. El protocolo que OpenAire sigue para la extracción de los metadatos de las publicaciones científicas es la versión 2.0 del Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH v2.0). Los contenidos expuestos deben permitir la extracción de los metadatos requeridos por el OpenAire (Set Content) y organizados según el formato Dublin Core. Uno de los metadatos es el enlace al contenido original

A finales de 2017 y principios de 2018, SciELO desarrolló la capacidad de organizar los metadatos de los artículos SciELO requeridos por el OpenAire en el formato Dublin Core y ponerlos a disposición na condición de agregador y de acuerdo con el protocolo OAI-PMH v2.0.

OpenMinTED opera también con proveedores de contenido, ya sea de publicaciones o de datos de búsqueda. Pero, a diferencia de OpenAire, OpenMinTED opera con copias de los datos originales, como son los textos completos en el caso de las publicaciones científicas. Para acceder a los textos completos y otros tipos de contenido, OpenMinTED hace uso de los metadatos de OpenAire. Es decir, los proveedores de datos para OpenMinTED deben previamente constituirse como proveedor de OpenAire.

A principios de 2018 SciELO desarrolló también la capacidad de proveedor de datos de OpenMinTED que resultará en la disponibilidad de los textos completos de todos los artículos cuya licencia Creative Commons permite derivados de los textos.

La plataforma operacional de OpenMinTED está en desarrollo comprendiendo las funciones o servicios de disponibilidad abierta de los contenidos para uso de aplicaciones de minería de textos y datos así como de herramientas y soluciones de explotación de los contenidos y sus resultados. La minería de datos consiste en procesos conducidos por programas informáticos especializados en técnicas de análisis exhaustivo de textos no estructurados y datos estructurados para identificar las estructuras, estándares y las tendencias que informen y automatizar los procesos de toma de decisiones. Esta función de descubrir o revelar estructuras y patrones a partir del análisis de textos y datos es interpretada comúnmente como extracción de conocimiento previamente desconocido.

El desarrollo de la capacidad de proveedor de datos de SciELO tanto para OpenAire como para OpenMinTED fue apoyado por una ayuda de 25 mil euros aportados por el proyecto OpenMinTED en la llamada pública de proyectos para apoyar el desarrollo de la plataforma. La unidad técnica de SciELO Brasil con el apoyo de la coordinación de SciELO España y del Taller Técnico General (OTG) del Plan TL en el área de Biomedicina de la Secretaría de Estado de Telecomunicaciones y para la Sociedad de la Información elaboró y presentó una propuesta de proyecto1 según los términos de la llamada pública para convertirse en proveedor de datos, la cual fue aprobada por el comité responsable de la evaluación de las propuestas. En resumen, el proyecto SciELO solicitó apoyo para el desarrollo de la organización de los metadatos de los artículos según el formato Dublin Core y su exposición según el protocolo OAI-PMH v2.0. El resultado del proyecto enriquece la plataforma tecnológica de SciELO. El código está abierto, disponible bajo licencia BSD. Es importante destacar que todo el tráfico entre el proveedor OAI y el cliente está cifrado, a través del uso del protocolo HTTPS.

La presencia de los artículos de las revistas SciELO en las plataformas OpenAire y OpenMinTED contribuirá al objetivo del programa de promover la visibilidad, uso e impacto de las revistas indexadas por las colecciones nacionales de la Red SciELO y de las investigaciones que comunican. El programa SciELO tiene como principios la comunicación de las investigaciones en acceso abierto, el trabajo en red y el control de calidad en todas las instancias y etapas del proceso editorial. El programa opera mediante un modelo de publicación de revistas que integra las funciones de indexación, almacenamiento, preservación y recuperación de textos completos, publicación e interoperabilidad. En resumen, SciELO busca maximizar la disponibilidad y uso de las revistas y de los artículos. En el caso de OpenMinTED, la perspectiva de identificación de nueva información y conocimiento a partir del análisis de los textos de los artículos contribuirá a ampliar la visibilidad e impacto de los resultados de las investigaciones que comunican.

Nota

1. Propuesta redactada por Fabio Batalla y Abel Packer titulada “Proposal to empower SciELO Network to provide journals article in the OpenMinTED platform through the OpenAire repository” enviado al OpenMinTED en 2017.

Referencias

OpenAIRE Guidelines for Literature Repositories [online]. OpenAIRE Guidelines. 2015 [viewed 09 February 2018]. Available from: https://guidelines.openaire.eu/en/latest/literature/index.html

Phase II: call for TDM Software and Knowledge Resources [online]. Open Tenders. 2017 [viewed 09 February 2018]. Available from: https://openminted.bsc.es/

What is Horizon 2020? [online]. European Comission. 2014 [viewed 09 February 2018]. Available from: https://ec.europa.eu/programmes/horizon2020/what-horizon-2020

Enlaces externos

Dublin Core Metadata Element Set, Version 1.1: Reference Description <http://dublincore.org/documents/dces/>

OpenAIRE <https://www.openaire.eu/>

OpenAIRE Guidelines <https://guidelines.openaire.eu/en/latest/>

OpenMinTED Glossary <https://vocabularies.openminted.eu/skosmos/omtd_glossary/en/page/OMTDglossary>

Provedor de dados OAI-PMH para Rede SciELO <https://github.com/scieloorg/oai-pmh>

The Open Archives Initiative Protocol for Metadata Harvesting <http://www.openarchives.org/OAI/openarchivesprotocol.html>

 

Traducido del original en Portugués por Ernesto Spinak.

 

Como citar este post [ISO 690/2010]:

PACKER, A.L. and FONSECA, G. Los artículos de las revistas SciELO en las plataformas de Ciencia Abierta de la Comisión Europea [online]. SciELO en Perspectiva, 2018 [viewed ]. Available from: https://blog.scielo.org/es/2018/03/09/los-articulos-de-las-revistas-scielo-en-las-plataformas-de-ciencia-abierta-de-la-comision-europea/

 

Leave a Reply

Your email address will not be published.

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Post Navigation