Por Ernesto Spinak
La publicación de los resultados de estudios académicos en acceso abierto es cada vez más frecuente y se estima que actualmente hay disponibles millones de documentos online. Por esta razón es importante tener herramientas eficientes para encontrar las versiones libres de los artículos que precisamos (sin pagar suscripciones o comprando artículos individuales y usando métodos legales). Como la necesidad va creando la oferta, en los dos o tres años recientes han comenzado a surgir aplicaciones gratuitas para satisfacer los requerimientos de los académicos, bibliotecarios, investigadores y estudiantes en general. ¿Cuál es el mercado de oferta hoy?
Es aquí que entra en escena mi Nerd favorito, Aaron Tay, un bibliotecario en la Singapur Management Library, que recientemente escribió algunas notas1,2 en su blog analizando diversos plugins para los navegadores y también los servicios de agregadores que permiten encontrar en forma casi instantánea textos completos en acceso abierto.
La tabla siguiente presenta los diferentes servicios analizados por Aaron Tay en varios posts (los enlaces se presentan al final) con algunos comentarios y evaluaciones mías (que soy algo viejo para ser nerd!). Más abajo en este post mostraremos ejemplos de los dos plugins que nos han parecido más eficientes – o sea: son los que yo uso – pero sería un buen ejercicio que usted haga sus propias pruebas.
|
Este servicio creado por la Bielefeld University Library en Alemania, es probablemente uno de los agregadores más grandes y avanzados del mundo, superando en noviembre de 2016 los 100 millones de documentos. BASE asegura que por lo menos un 40% de los textos identificados están en acceso abierto, no pudiendo asegurarlo del resto por la falta de metadatos en los repositorios. A través del servicio de oadoi.org tiene acceso a más de 5.000 repositorios. Sin embargo, BASE no indiza el contenido de esos textos completos. La interfaz de búsqueda es muy avanzada, posiblemente la más amigable de toda la familia de plugins analizados. |
|
CORE dice tener cerca de 70 millones de documentos que, al igual que BASE, son recuperados por el protocolo OAI-PMH. Por esta razón también tiene el mismo problema de vincular con certeza los textos completos debido a la falta de normalización de los metadatos en los repositorios institucionales, en particular los “Green OA” (ver nota al final de la tabla). En cambio, CORE indiza el contenido de estos textos completos. |
|
Está en versión beta, tiene indizados cerca de 100 millones de documentos. Es una versión simple por ahora limitada a buscar solo por el nombre del autor. Entrega los resultados rápidamente indicando cuáles están en acceso abierto. |
|
Lanzado en 2014, es un plugin que, de momento, solo funciona en navegador Google Chrome. Es la extensión más compleja (algo complicada también) y, entre varios servicios, puede verificar si su institución tiene suscripciones al texto completo, presentar varias métricas de citación, obtener comentarios de sistemas como Pubmed Commons, le ofrece funciones que le permiten crear citaciones, y recuperar documentos relacionados con su consulta que pueden ser de interés, también en acceso abierto. Sugerencia: cuando yo lo instalé, por simplicidad, marqué NO en casi todos los parámetros. Vale la pena analizarlo (aunque después no lo use). |
|
Propiedad de OCLC, es un catálogo colectivo que declara más de 50 millones de registros de recursos en acceso abierto, provenientes de la recolección por OAI-PMH de más de 2.000 fuentes que contribuyen al catálogo. Los registros también están disponibles en la interface de WorldCat. Tiene las mismas limitaciones que se indicaron para BASE, CORE y colecciones basadas en el protocolo OAI-PMH, limitaciones que se explican al final de esta tabla. |
|
Es un plugin creado en 2013 por dos estudiantes y debe instalarse en un navegador que no sea IExplorer, pero se instala fácilmente en Google Chrome. Tiene algunos miles de usuarios registrados. En mis experimentos no tuve mucho éxito. |
|
Creado en 2015, se instala en forma directa y es, posiblemente, la opción preferida. Ver ejemplo por separado más abajo en este blog. |
|
Es el más nuevo de la familia, y puede ser una segunda opción. Ver ejemplo por separado más abajo en este blog. |
Nota sobre las limitaciones del “harvester OAI-PMH”
El Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) es un protocolo desarrollado para recolectar descripciones de metadatos de registros electrónicos depositados en archivos de modo que el servicio pueda crear índices de consulta. La implementación de OAI-PMH requiere que los metadatos sigan la norma Dublin Core. Los motores de indexación y agregadores de servicios basados en el protocolo OAI-PMH tienen dificultades con la cobertura de los repositorios institucionales, debido a que estos repositorios son muy heterogéneos y usan una gran diversidad de sistemas de administración de archivos. Además, por carecer de estándares claros de metadatos no es simple para los robots indexadores determinar si los registros señalan o no a textos completos gratuitos. Este problema se añade a las dificultades de indexar los registros basados en metadatos Dublin Core, como describí anteriormente en este blog3 referente a la indexación de repositorios por Google Scholar.
Complementando los comentarios del artículo referido1, para comprenderse mejor, debemos decir que en la historia de los repositorios de acceso abierto, el protocolo OAI-PMH se estableció para recopilar solamente los metadatos y no los textos completos. La razón detrás de este protocolo fue que se suponía que la mayoría (si no todos) los repositorios ofrecerían los textos en acceso abierto (como el modelo ArXiv), y por este motivo en el protocolo OAI-PMH hasta ahora no hay un campo que indique si el texto completo es de acceso libre o no.
El problema entonces surge al indexar los miles de repositorios institucionales debido a que la función que cumplen para esas instituciones va más allá que el simple depósito de documentos completos en libre acceso. Entre otros fines está apoyar el “autoarchivo” a los académicos, preservar un registro de las actividades de la universidad y demostrar la relevancia de sus actividades científicas, económicas y sociales, para aumentar su visibilidad y estatus. Por estos motivos, como dice Aaron Tay, es posible que los repositorios institucionales no tengan más que un tercio de sus documentos con textos completos accesibles. Debido a esas limitaciones, los agregadores de documentos en acceso abierto hacen caso omiso a estos problemas, e indexan los repositorios en su totalidad dando la idea equivocada de que todo es de acceso libre al texto completo.
Para hacer las pruebas yo instalé las aplicaciones en mi versión de Google, y los botones aparecieron en la barra de herramientas del navegador como se ve en la figura:
(1) Lazy Scholar; (2) Google Scholar button; (3) Open Access button; (4) Unpaywall button;
Google Scholar button
Es un plugin lanzado en el año 2015 que se instala en forma simple y directa. ¿Cómo funciona? Supongamos que está en una página a la que no llegó a través del Google Scholar y quiere saber si existe una versión de acceso libre de ese documento. Lo que debe hacer entonces es marcar el título del artículo con el ratón y pinchar el ícono en la barra de herramientas (el 2 en la figura de nuestra barra de herramientas). Google Scholar buscará en background y abrirá en una ventana secundaria a la derecha presentando todas las versiones de acceso libre que tiene indexadas:
Unpaywall button
Una vez que instala la extensión, cuando llegue a una página de un documento cualquiera, aparecerá en el margen derecho de su pantalla el ícono de un candado, que puede estar en diferentes colores que tienen los siguientes significados.
- Verde: el texto completo está en un repositorio institucional o servidor de preprints
- Dorado: es un artículo de una revista que tiene licencia de acceso abierto
- Azul: está en una revista que no tiene licencia de acceso abierto
- Negro: no encuentra otras versiones en su índice.
En el ejemplo que sigue, el candado a la derecha indica que hay una versión accesible, y si se pincha el ícono llevará al texto requerido que tienen la URL que se muestra debajo de la figura:
URL: http://rspb.royalsocietypublishing.org/content/royprsb/284/1852/20170224.full.pdf
¿Son efectivas estas herramientas para encontrar textos libres?
En términos de eficiencia podemos dividir estas herramientas en dos niveles:
- en el primer nivel están las que se basan en la búsqueda directa por Google Scholar, Lazy Scholar button, también Google Scholar button y Unpaywall button.
- en segundo nivel estarían todas las otras herramientas analizadas en esta nota.
El motivo es que Google Scholar es el índice de material académico más grande disponible a pesar de que tenga limitaciones al indexar los repositorios. Todas las otras iniciativas, de momento, son mucho menores en términos de cobertura incluyendo los agregadores como BASE y CORE por los motivos explicados más arriba. Por otra parte Google Scholar ha desarrollado algoritmos muy eficientes que permiten distinguir de una obra sus diferentes manifestaciones de un mismo artículo (preprints, versionados, posprints, etc.)
Además, Google Scholar no solamente indexa repositorios sino toda clase de sitios incluyendo las páginas web de las universidades. Estos documentos son invisibles a la mayoría de los plugins analizados que se restringen mayormente a repositorios, mientras que Google Scholar indexa todos los documentos que parecen ser académicos incluidos en sitios de extensión: . edu.
También debe indicarse, que los servicios del tipo Open Access button y los que usan Oadoi.org y similares, no indexan artículos disponibles en ResearchGate o Academia.edu, debido a las fuertes sospechas de que muchos de esos documentos depositados por los autores violan los acuerdos de derechos con las revistas, pero son indexados por Google Scholar. Según un reciente artículo4 de Scientometrics, se indica que hasta un 40% de los PDF depositados en Research Gate violan los acuerdos de copyright.
Mi opinión
La cantidad de documentos a texto completo de libre acceso que es posible recuperar con estas herramientas tiene como límite superior lo indizado por Google Scholar y como límite inferior los documentos de acceso “legal” que se recuperan con OAIster y OA button, etc.
Lamentablemente debido a la amplísima distribución de documentos en miles de lugares diferentes, y la falta de consistencia de las normas con que trabajan los agregadores de datos, ningún método es 100% confiable ni consistente para encontrar todos los textos completos en acceso abierto.
Dado que estas herramientas son muy nuevas, sólo dos o tres años de desarrollo, mi decisión es que Google Scholar button y Unpaywall button son las más efectivas.
Esta opinión es provisional, y es válida hasta que mi Nerd favorito me sugiera otra cosa.
Notas
1. TAY. A. 5 services to help researchers find free full text instantly & a quick assessment of effectiveness [online]. Musings about librarianship, 2017. [viewed 03 May 2017]. Available from: http://musingsaboutlibrarianship.blogspot.com/2017/03/5-services-to-help-researchers-find.html
2. TAY. A. The open access aggregators challenge — how well do they identify free full text? [online] Musings about librarianship, 2017. [viewed 03 May 2017]. Available from: http://musingsaboutlibrarianship.blogspot.com/2017/01/the-open-access-aggregators.html
3. SPINAK, E. Repositorios en América Latina tienen poca visiblidad en Google Scholar [online]. SciELO en Perspectiva, 2014 [viewed 15 April 2017]. Available from: http://blog.scielo.org/es/2014/09/18/repositorios-en-america-latina-tienen-poca-visiblidad-en-google-scholar/
4. JAMALI, H.R. Copyright compliance and infringement in ResearchGate full-text journal articles. Scientometrics [online]. 2017, pp 1-14 [viewed 15 April 2017]. DOI: 10.1007/s11192-017-2291-4. Available from: http://link.springer.com/article/10.1007/s11192-017-2291-4
Referencias
100 MillionenNachweise in BASE [online]. BASE Weblog, 2016. Available from: http://ekvv.uni-bielefeld.de/blog/base/entry/100_millionen_nachweise_in_base
JAMALI, H.R. Copyright compliance and infringement in ResearchGate full-text journal articles. Scientometrics [online]. 2017, pp 1-14 [viewed 15 April 2017]. DOI: 10.1007/s11192-017-2291-4. Available from: http://link.springer.com/article/10.1007/s11192-017-2291-4
Protocol for Metadata Harvesting [online]. Wikipedia. 2017 [viewed 03 May 2017]. Available from: http://en.wikipedia.org/wiki/Protocol_for_Metadata_Harvesting
SPINAK, E. Repositorios en América Latina tienen poca visiblidad en Google Scholar [online]. SciELO en Perspectiva, 2014 [viewed 15 April 2017]. Available from: http://blog.scielo.org/es/2014/09/18/repositorios-en-america-latina-tienen-poca-visiblidad-en-google-scholar/
TAY. A. 5 services to help researchers find free full text instantly & a quick assessment of effectiveness [online]. Musings about librarianship, 2017. [viewed 03 May 2017]. Available from: http://musingsaboutlibrarianship.blogspot.com/2017/03/5-services-to-help-researchers-find.html
TAY. A. The open access aggregators challenge — how well do they identify free full text? [online] Musings about librarianship, 2017. [viewed 03 May 2017]. Available from: http://musingsaboutlibrarianship.blogspot.com/2017/01/the-open-access-aggregators.html
Enlaces externos
BASE – <http://www.base-search.net/>
CORE – <http://core.ac.uk/about>
Dissemin – <http://dissem.in/>
Google Scholar button – <http://chrome.google.com/webstore/detail/google-scholar-button/ldipcbpaocekfooobnbcddclnhejkcpn?hl=en>
Lazy Scholar button – <http://www.lazyscholar.org/>
OAdoi – <http://oadoi.org/faq>
OAIster – <http://www.oclc.org/en/oaister.html>
Open Access button – <http://openaccessbutton.org/>
Unpaywall – <http://unpaywall.org/>
Sobre Ernesto Spinak
Colaborador do SciELO, Ingeniero en Sistemas y Lic. en Biblioteconomía, con Diploma de Estudios Avanzados pela Universitat Oberta de Catalunya y Maestría en “Sociedad de la Información” por la Universidad Oberta de Catalunya, Barcelona – España. Actualmente tiene una empresa de consultoría que atiende a 14 instituciones de gobierno y universidades en Uruguay con proyectos de información.
Como citar este post [ISO 690/2010]:
Lea el comentario en inglés, por JURN:
http://blog.scielo.org/en/2017/05/26/how-to-find-articles-in-open-access-tips-from-my-favorite-nerd/#comment-137941
Lea el comentario en inglés, por Aaron Tay:
http://blog.scielo.org/en/2017/05/26/how-to-find-articles-in-open-access-tips-from-my-favorite-nerd/#comment-137999
Lea el comentario en inglés, por Jason Priem:
http://blog.scielo.org/en/2017/05/26/how-to-find-articles-in-open-access-tips-from-my-favorite-nerd/#comment-138013