Introducción a JATS (Journal Article Tag Suite)

Por Debbie Lapeyre

Imagen adaptada del original, por Krauss.

La “JATS”, conocida formalmente como ANSI/NISO Z39.96-2015 JATS: Journal Article Tag Suite, es un conjunto de tags (etiquetas) XML estándar internacional para artículos de revistas. JATS es un vocabulario XML (similar en su finalidad a otros vocabularios XML basados en documentos, como DocBook o TEI), diseñada para modelar artículos de revistas corrientes. JATS es una colección con nombres de elementos y atributos XML que se pueden usar para marcar la estructura y la semántica de un artículo individual de revista. Por lo tanto, JATS no modela colecciones de revistas, libros, corpus en un idioma, patentes, legislación, estándares u otros tipos de documentos. Originalmente, JATS se usaba para artículos STEM (científicos, técnicos, de ingeniería y médicos), pero ahora las revistas de humanidades, sociología, economía y ciencias blandas también usan el marcado XML de JATS.

JATS tiene tres modelos separados, destinados a audiencias distintas:

  • Modelo de Archivo e Intercambio (laxo, para que las bibliotecas y los archivos incorporen XML en sus repositorios);
  • Modelo de Publicación de Artículos de Revistas (más estricto, para la producción de publicaciones, generalmente utilizado por editores, plataformas de almacenamiento y portales); y/o
  • Modelo de Creación de Artículo (diseñado para los autores del artículo).

Propósito original de la JATS

La JATS se construyó originalmente para intercambiar artículos de revistas, proporcionando interoperabilidad del contenido del artículo y los metadatos del artículo entre editores y archivos. En los primeros tiempos, se esperaba que los editores, hosters, portales y archivos usaran su propio conjunto de tags XML internamente y se transformaran en JATS XML cuando quisieran para:

  • Intercambiar información entre sí;
  • Poner la información en un repositorio combinado;
  • Vender/mostrar artículos en la misma plataforma de alojamiento; y/o
  • Compartir el desarrollo de herramientas y recursos de uso común.

El mundo publica artículos de revistas en JATS

Pero desde que JATS surgió en febrero de 2003, muchos editores han encontrado que JATS es útil para la producción y la Prueba de Control de calidad de artículos y preprints. Si bien JATS todavía se usa ampliamente para construir grandes repositorios de revistas y para el intercambio de organización a organización, los editores también han estado produciendo su nuevo contenido en JATS. Los editores más grandes siguen utilizando sus propios conjuntos de etiquetas, pero los editores pequeños y medianos están codificando sus nuevas revistas en JATS y convirtiendo sus archivos de respaldo de PDF o un conjunto de etiquetas propietario en JATS. Los archivos públicos, como bibliotecas y portales académicos, encuentran conveniente recibir datos de artículos de muchas fuentes en un solo formato. Los archivos privados y comerciales pueden requerir JATS para su ingreso, o pueden transformar cualquier formato que reciban en JATS para su sitio web/repositorio /aplicación.

Numerosos proveedores de servicios y alojamiento web requieren o admiten JATS. Las transformaciones públicas y gratuitas hacen que Crossref deposite archivos desde JATS. Comunidades enteras han acordado en un formato de datos para el contenido de la revista.

JATS está en uso en más de 25 países en todo el mundo, incluyendo: Australia, Bélgica, Brasil, Bulgaria, Canadá, Chile, Egipto, Finlandia, Francia, Alemania, Italia, Japón, Noruega, Rusia, Corea del Sur, Suecia, Suiza, Emiratos Árabes Unidos, el Reino Unido y los Estados Unidos. La mayoría de las editoriales medianas/pequeñas en América del Norte y Europa utilizan JATS, con muchos países asiáticos y países de América del Sur producen al menos algunas revistas en JATS. Todos los editores realmente grandes (que usan sus propios modelos de revistas internamente) pueden (y lo hacen) usar JATS para el intercambio y el depósito. Muchos archivos públicos y privados aceptan (o requieren) JATS, incluyendo: PubMed Central (tanto en los EE. UU. Como en el Reino Unido), la Biblioteca Nacional Británica, la Biblioteca Nacional de Australia, la Biblioteca del Congreso de los EE. UU., Portico/ITHAKA/JSTOR, y muchos más.

Los proveedores de servicios de conversión de todo el mundo han desarrollado procesos para y han adquirido una experiencia significativa en la conversión hacia y desde JATS. El uso de un conjunto de tags compartidas significa que los proveedores de conversión no necesitan aprender/personalizar un conjunto de tags de revistas para cada editor. Se han desarrollado herramientas para hacer JATS desde muchos formatos, incluyendo Microsoft Word y LaTeX, y para hacer PDF, HTML (HTML, XHTML, HTML5) de calidad, varios formatos accesibles y libros electrónicos desde JATS.

Estructura de un artículo JATS

Por diseño, la JATS modela lo que los editores de revistas ya están haciendo. Cuando se diseñó JATS, se examinaron cientos de revistas en busca de estructuras y metadatos y se examinaron más de 45 modelos de revistas existentes en XML y SGML. Los diseñadores intentaron por el caso 80/20; es decir, si el 80% de las revistas marcaron los datos de manera similar, JATS también eligió esos elementos, incluso si los diseñadores de JATS pensaron que podrían imaginar una mejor manera de etiquetar el material. Para el 20% no cubierto explícitamente, las tramas de escape de etiquetado se agregaron a JATS: un elemento contenedor de nombre-valor para los metadatos, un elemento en línea de contenido con nombre para capturar el etiquetado-semántico-específico-del-editor y un elemento de contenido-con-estilo para registrar distinciones no-semánticas-en-línea de look-and-feel. La intención de las estructuras semánticas específicas del editor (como las declaraciones de disponibilidad de datos) se pueden capturar con atributos de clasificación de información

La JATS trata de no dirigir o coaccionar a los editores, sino de capturar la práctica habitual de las revistas. JATS conserva el orden real del texto (secuencia de lectura) tanto como sea posible y normalmente no define ni establece “Mejores prácticas”.

La idea es que sea lo más sencillo posible para codificar los artículos de revistas de cualquier persona en JATS. Para hacer esto más fácil, JATS es un modelo de documento a la antigua, con metadatos relacionados con el artículo (y la revista, si corresponde) al principio y en el cuerpo y en la parte posterior del artículo después de los metadatos. Este modelo (que se muestra a continuación en forma de esquema) se ajusta a la producción corriente de la revista.

  • Front Matter (<front>)
    • Metadatos a nivel de revista (título de la revista e identificadores);
    • Metadatos a nivel de artículo (título del artículo, autor(es), identificadores como un DOI).
  • Body Matter (<body>)
    El texto narrativo del artículo, incluyendo, por ejemplo:

    • Párrafos;
    • Secciones;
    • Figuras y graficas;
    • Tablas (tanto XHTML como CALS);
    • Ecuaciones y citas.
  • Back Matter (<back>)
    • Apéndices;
    • Listas de referencias bibliográficas con información detallada (pero completamente opcional), metadatos de citas.

Metadatos de búsqueda, minería, extracción

Además de marcar la estructura de un artículo, JATS puede (siempre opcionalmente) proporcionar metadatos ricos necesarios para el intercambio semántico, la búsqueda sensible al contexto y la minería de datos. Los metadatos extensos que se pueden describir en JATS viajan con el artículo XML, no se guardan en un archivo o base de datos independiente. Por ejemplo, JATS puede incluir muchos identificadores externos procesables por máquina, tales como:

  • Identificadores de componentes de artículos y artículos, como DOI y números arXiv;
  • Identificadores de autor como ORCIDs;
  • Identificadores de instituciones (por ejemplo, Ringgold, ISNI); y
  • Identificadores del financiador.

Los metadatos a nivel de artículo para la cita del artículo y el crédito para los autores pueden incluir:

  • Título del artículo (con idiomas alternativos si se desea);
  • Identificadores de artículos (DOI, identificadores de editor, etc.);
  • Derechos de autor y permisos;
  • Resúmenes múltiples (para capturar resúmenes seccionales, resúmenes gráficos, resúmenes estereoquímicos, resúmenes de longitud de Twitter, resúmenes de RSS/Atom y resúmenes de párrafos ordinarios);
  • Encontrar ayudas tales como palabras clave, términos y clasificaciones de temas (que pueden darse en múltiples idiomas y vincularse a ontologías/taxonomías); y
  • Descripciones detalladas de la financiación detrás de la investigación sobre la cual se informa el artículo, que incluye:
    • Fondos tanto monetarios como no monetarios;
    • Identificadores de becas y donaciones;
    • Fuentes de financiación y directores;
    • Enlaces a artículos o recursos complementarios (versiones en diferentes idiomas, erratas, actualizaciones, libros relacionados o páginas web).

Los colaboradores de la redacción y la investigación detrás de un artículo no son los únicos autores y editores que se citan normalmente para los artículos hoy en día. Los colaboradores también pueden ser fotógrafos, diseñadores de estudios, curadores, secuenciadores del genoma, recolectores de muestras, artistas de visualización y otros roles mencionados. El material que JATS puede registrar con respecto a un colaborador puede incluir:

  • Identificadores externos únicos;
  • La capacidad de registrar iniciales y nombres completos;
  • La capacidad de tener solo un nombre de pila, sin un apellido, como es la costumbre en algunos países del sudeste asiático;
  • Nombres alternativos para una persona (por ejemplo, caracteres japoneses y una versión romanizada);
  • Descripción del rol o roles desempeñados por la persona (posiblemente vinculado a los términos de la taxonomía de CRediT);
  • Múltiples afiliaciones (con nombres alternativos para múltiples idiomas).

Las referencias bibliográficas detalladas de un artículo permiten el seguimiento de publicaciones y ayudan a establecer relevancia científica a través de citas. Los componentes nombrados de una referencia permiten que el software verifique las referencias con Crossref, figshare o otro repositorio DOI para mejorar la precisión de la referencia. JATS puede admitir casi cualquier tipo y estilo de etiquetado de referencia, incluida la cita de datos (con tiempos de acceso). Para citar artículos de revistas, los elementos específicos incluyen nombres de contribuidores, títulos de artículos, títulos y números de revistas, números de primera y última página, día-mes-año de publicación, DOI, y más. De manera similar, JATS ha denominado elementos suficientes para citar libros, patentes, documentos de conferencias, estándares y otros trabajos.

Ventajas de JATS para artículos de revistas

¿Por qué podría considerar JATS si usted produce artículos de revistas?

Declarativo: el marcado JATS es estructural o semántico y declarativo, no de presentación o comportamiento. Esto hace que los artículos sean más fáciles de procesar y ayuda a garantizar datos de mayor duración.

Diseñado para artículos: JATS es un modelo XML que se adapta a la forma en que se publican las revistas (y preprints) hoy.

El conjunto de etiquetas está documentado: las Extensive Tag Libraries con explicaciones y ejemplos para el uso de elementos y atributos están disponibles en línea, al igual que muchas recomendaciones de mejores prácticas.

El precio es correcto: los conjuntos de etiquetas (en formato DTD, XSD y RNG), la documentación de la biblioteca de etiquetas, los ejemplos etiquetados y algunas herramientas para el control de calidad y la producción de salida están disponibles de forma gratuita en:

Alta y fácilmente personalizable: JATS fue diseñada para ser extendida y ampliada muy fácilmente. Los mecanismos de extensión incorporados están documentados en las bibliotecas de etiquetas.

No es un estándar estático: JATS cambia a medida que los editores y otros usuarios solicitan nuevas funciones o modificaciones. Sus comentarios pueden enviarse a <www.niso.org/standards-committees/jats>.

En resumen, JATS no es nueva, sexy ni emocionante, pero es inmensamente útil en el mundo de las revistas. En las palabras de Jeff Beck (de PubMed Central):

“JATS no es más un de los niños genios; es solo lo que haces si tienes artículos de revistas.”

Enlaces externos

Journal Article Tag Suite <https://jats.nlm.nih.gov/>

Standardized Markup for Journal Articles: Journal Article Tag Suite (JATS) <www.niso.org/standards-committees/jats>

 

Sobre Deborah Lapeyre

Deborah Lapeyre (junto con Tommie Usdin) se desempeña como secretaria y arquitecta principal de JATS (ANSI NISO Z39.96-2015 Journal Article Tag Suite), así como para dos conjuntos de etiquetas basados en JATS: BITS (Book Interchange Tag Suite) y NISO STS (American National Standard, STS: Standards Tag Suite, ANSI/NISO Z39.102-2017). La Sra. Lapeyre formó parte del equipo inicial de diseño de JATS y fue la desarrolladora principal que creó JATS a partir de una DTD de NLM más antigua y el análisis de más de 45 conjuntos de tags específicas para editores. Actualmente trabaja como Consultora Senior de XML para Mulberry Technologies, Inc., una firma de consultoría especializada en ayudar a sus clientes hacia una mejor publicación a través de las soluciones XML, XSLT y Schematron. Es profesora y experta en diseño de vocabulario XML con DTD y desarrollo de esquemas. Ha estado desarrollando sistemas que manipulan documentos etiquetados desde 1980, trabajando con SGML desde antes de que se convirtiera en un estándar internacional, y con XML y XSLT desde su inicio.

 

Basado en una presentación dada en la Semana SciELO 20 Años en septiembre de 2018.

Traducido del original en inglés por Ernesto Spinak.

 

Como citar este post [ISO 690/2010]:

LAPEYRE, D.A. Introducción a JATS (Journal Article Tag Suite) [online]. SciELO en Perspectiva, 2018 [viewed ]. Available from: https://blog.scielo.org/es/2018/10/31/introduccion-a-jats-journal-article-tag-suite/

 

2 Thoughts on “Introducción a JATS (Journal Article Tag Suite)

  1. Pingback: Introducción a JATS (Journal Article Tag Suite)

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Post Navigation