Introdução à JATS (Journal Article Tag Suite)

Por Deborah Lapeyre

Imagem adaptada da original por Krauss.

A “JATS”, formalmente conhecida como ANSI/NISO Z39.96-2015 JATS: Journal Article Tag Suite, é um padrão internacional de conjunto de tags (etiquetas) XML para artigos de periódicos. A JATS é um vocabulário XML (semelhante ao propósito de outros vocabulários XML baseados em documentos, como DocBook ou TEI) desenvolvido para modelar artigos de periódicos atuais. A JATS é uma coleção com nomes de elementos e atributos XML que podem ser usados para marcar a estrutura e a semântica de um artigo individual de periódico. Assim, a JATS não modela coleções de periódicos, livros, corpus em um idioma, patentes, legislação, padrões ou outros tipos de documentos. Originalmente, a JATS era usada para artigos STEM (do inglês, Ciência, Tecnologia, Engenharia e Medicina), mas agora os periódicos nas áreas de humanidades, sociologia, economia e ciências sociais também utilizam a marcação XML da JATS.

A JATS possui três modelos separados, destinados a públicos distintos:

  • Modelo de Arquivamento e Intercâmbio (menos restrito, para bibliotecas e arquivos incorporarem XML em seus repositórios);
  • Modelo de Publicação de Artigos de Periódico (mais restrito, para produção de publicações, normalmente usados por publishers, plataformas de hospedagem e portais);
  • Modelo de Autoria de Artigo (projetado para os autores do artigo).

Objetivo Original da JATS

A JATS foi originalmente construída para intercambiar artigos de periódicos, proporcionando interoperabilidade de conteúdo de artigos e metadados de artigos entre publishers e arquivos. No início, esperava-se que os publishers, hosters, portais e arquivos usassem seu próprio conjunto de tags XML internamente e se transformassem em XML JATS quando desejassem:

  • trocar informações entre si;
  • colocar informações em um repositório combinado;
  • vender/exibir itens na mesma plataforma de hospedagem; e/ou
  • compartilhar o desenvolvimento de ferramentas e recursos para uso comum.

O mundo publica artigos de periódico em JATS

Entretanto, desde que a JATS foi lançada em fevereiro de 2003, muitos publishers consideraram a JATS útil para os testes de produção e Garantia da Qualidade de artigos e preprints. Embora a JATS ainda seja amplamente usada para construir grandes repositórios de periódicos e para o intercâmbio entre organizações, os publishers também estão produzindo seu novo conteúdo em JATS. Os maiores publishers ainda usam seus próprios conjuntos de etiquetas, mas os publishers de pequeno e médio porte estão codificando seus novos periódicos em JATS e convertendo seus backfiles a partir do PDF ou um conjunto de tags proprietárias em JATS. Arquivos públicos, como bibliotecas e portais acadêmicos, acham conveniente receber dados de artigos de várias fontes em um único formato. Arquivos privados e comerciais podem requerer a JATS para serem ingressados, ou podem transformar qualquer formato que eles recebam em JATS para seu site/repositório/aplicativo.

Inúmeros fornecedores de hospedagem e de serviços na web requerem ou admitem JATS. As transformações públicas e gratuitas fazem que Crossref deposite arquivos a partir da JATS. Comunidades inteiras concordaram com um formato de dados para conteúdo de periódicos.

A JATS está em uso em mais de 25 países em todo o mundo, incluindo: Austrália, Bélgica, Brasil, Bulgária, Canadá, Chile, Egito, Finlândia, França, Alemanha, Itália, Japão, Noruega, Rússia, Coréia do Sul, Suécia, Suíça, Emirados Árabes Unidos, Reino Unido e Estados Unidos. A maioria dos pequenos e médios publishers na América do Norte e Europa utiliza JATS, com muitos países asiáticos e da América do Sul produzindo pelo menos alguns periódicos em JATS. Todos os publishers realmente grandes (que usam seus próprios modelos de periódico internamente) podem (e usam) JATS para intercâmbio e depósito. Muitos arquivos públicos e privados aceitam (ou requerem) JATS, incluindo: PubMed Central (EUA e Reino Unido), Biblioteca Nacional Britânica, Biblioteca Nacional Australiana, Biblioteca do Congresso dos EUA, Portico/ITHAKA/JSTOR, e muitos outros.

Os fornecedores de conversão em todo o mundo desenvolveram processos e ganharam experiência significativa na conversão para dentro e fora da JATS. Usar um conjunto de tags compartilhadas significa que os fornecedores de conversão não precisam aprender/personalizar um conjunto de tags de periódico para cada editor. Foram desenvolvidas ferramentas para criar a JATS a partir de vários formatos, incluindo Microsoft Word e LaTeX, e para criar PDF, HTML (HTML, XHTML, HTML5) de qualidade, vários formatos acessíveis e e-books a partir da JATS.

Estrutura de um artigo em JATS

Por design, a JATS modela o que os publishers de periódicos já estão fazendo. Quando a JATS foi projetada, centenas de periódicos foram examinados quanto à estrutura e metadados e mais de 45 modelos existentes de periódico XML e SGML foram examinados. Os designers tentaram o caso 80/20; ou seja, se 80% dos periódicos marcaram os dados de maneira semelhante, a JATS também escolheu estes elementos, mesmo que os projetistas do JATS considerassem que poderiam imaginar uma maneira melhor de marcar o material. Para os 20% não abordados explicitamente, as tramas de escape da marcação foram adicionadas à JATS: um elemento contentor de nome-valor para os metadados, um elemento in-line de conteúdo nomeado para capturar a marcação semântica específica do publisher e um elemento de conteúdo com estilo para registrar distinções não semânticas in-line de look-and-feel. A intenção das estruturas semânticas específicas do publisher (como as Declarações de Disponibilidade de Dados) pode ser capturada com atributos de classificação de informação.

A JATS tenta não liderar ou coagir publishers, porém capturar práticas comuns de periódicos. A JATS preserva a ordem de texto atual (sequência de leitura) tanto quanto possível e normalmente não define ou estabelece “Boas Práticas”.

A ideia é que seja o mais simples possível codificar os artigos de periódicos de qualquer pessoa em JATS. Para tornar isso mais fácil, a JATS é um modelo de documento à moda antiga, com metadados referentes ao artigo (e ao periódico, se apropriado) no início e no corpo e na parte final do artigo, após os metadados. Este modelo (mostrado abaixo em forma resumida) se encaixa na produção atual de periódicos.

  • Front Matter (<front>)
    • Metadados a nível do periódico (título do periódico e identificadores);
    • Metadados a nível do artigo (título do artigo, autor(es), identificadores como DOI).
  • Body Matter (<body>)
    O texto da narrativa do artigo, incluindo, por exemplo:

    • Parágrafos;
    • Seções;
    • Figuras e gráficos;
    • Tabelas (XHTML e CALS);
    • Equações e citações.
  • Back Matter (<back>)
    • Apêndices;
    • Lista de referências bibliográficas com informação detalhada (porém totalmente opcional), metadados de citação.

Metadados para busca, mineração e extração

Além de marcar a estrutura de um artigo, a JATS pode (sempre de forma opcional) fornecer metadados ricos necessários para intercâmbio semântico, pesquisa sensível ao contexto e mineração de dados. Os extensos metadados descritíveis na JATS viajam com o artigo XML, não bloqueados em um arquivo ou banco de dados separado. Por exemplo, a JATS pode incluir muitos identificadores externos processáveis por máquina, tais como:

  • Identificadores de componentes de artigos e artigos, como DOIs e números arXiv;
  • Identificadores de autor, como ORCIDs;
  • Identificadores da instituição (por exemplo, Ringgold, ISNI); e
  • Identificadores do financiador.

Metadados a nível do artigo para citação do artigo e crédito aos autores podem incluir:

  • Título do artigo (com idiomas alternativos, se desejado);
  • Identificadores de artigos (DOI, identificadores de publishers, etc.);
  • Direitos autorais e permissões;
  • Múltiplos resumos (para capturar resumos de seções, resumos gráficos, resumos estereoquímicos, resumos do Twitter, resumos de RSS/Atom e resumos de parágrafos comuns);
  • Encontrar ajuda como palavras-chave, termos e classificações de assunto (que podem ser em vários idiomas e ligados a ontologias/taxonomias); e
  • Descrições detalhadas do financiamento por trás da pesquisa sobre a qual o artigo reporta, incluindo:
    • Fontes de financiamento monetário e não monetário;
    • Identificadores de bolsas e doações;
    • Fontes de financiamento e princípios.
  • Links para artigos ou recursos complementares (versões em diferentes idiomas, erratas, atualizações, livros relacionados ou páginas web).

Os colaboradores na redação e na pesquisa detrás de um artigo não são os únicos autores e publishers normalmente citados nos artigos hoje em dia. Os colaboradores também podem ser fotógrafos, designers do estudo, curadores, sequenciadores de genoma, colecionadores de espécimes, artistas de visualização e outras funções mencionadas. O material que a JATS pode registrar referente a um colaborador pode incluir:

  • Identificadores externos únicos;
  • A capacidade de registrar iniciais e nomes completos;
  • A capacidade de ter apenas um determinado nome, sem um sobrenome, como é o costume em alguns países do sudeste asiático;
  • Nomes alternativos para um indivíduo (caracteres japoneses e uma versão romanizada, por exemplo);
  • Descrição do papel ou papéis desempenhados pela pessoa (possivelmente ligados a termos de taxonomia do CRediT);
  • Várias afiliações (com nomes alternativos para vários idiomas).

Referências bibliográficas detalhadas para um artigo permitir o rastreamento de publicações e ajudar a estabelecer relevância científica por meio de citações. Os componentes nomeados de uma referência permitem que o software verifique referências no Crossref, no Figshare ou outro repositório DOI para melhorar a precisão de referência. A JATS pode suportar praticamente qualquer tipo e estilo de marcação de referência, incluindo citação de dados (com tempos de acesso). Para citar artigos de periódicos, os elementos específicos incluem nomes dos contribuintes, título do artigo, título e edição do periódico, números da primeira e da última página, dia-mês-ano de publicação, DOI e mais. Da mesma forma, a JATS nomeou elementos suficientes para citar livros, patentes, documentos de conferências, padrões e outros trabalhos.

Vantagens da JATS para artigos de periódicos

Porque você deveria considerar o JATS se você produz de artigos de periódicos?

Declarativo: A marcação JATS é estrutural ou semântica e declarativa, não de apresentação ou comportamento. Isso torna os artigos mais fáceis de processar e ajuda a garantir dados de maior durabilidade.

Desenhado para artigos: A JATS é um modelo XML que se enquadra na forma como periódicos (e preprints) são publicados hoje em dia.

O conjunto de etiquetas está documentado: As Extensive Tag Libraries com explicações e exemplos para o uso de elementos e atributos estão disponíveis on-line, assim como recomendações sobre Boas Práticas.

O preço é justo: Conjuntos de tagstag sets – (em formato DTD, XSD e RNG), documentação de biblioteca de etiquetas (Tag Library documentation), exemplos de tags, e algumas ferramentas para controle de qualidade e produção de conteúdo estão disponíveis gratuitamente em:

Alta e facilmente personalizável: A JATS foi desenhada para ser estendida e ampliada muito facilmente. Os mecanismos de extensão incorporados estão documentados nas Tag Libraries (bibliotecas de tags).

Não é um padrão estático: A JATS evolui na medida em que publishers e outros usuários requisitam novas funcionalidades ou modificações. Seus comentários podem ser submetidos em <www.niso.org/standards-committees/jats>.

Em suma, a JATS não é nova, sexy ou empolgante, mas é extremamente útil no mundo editorial. Nas palavras de Jeff Beck (do PubMed Central):

“A JATS não é mais um dos jovens descolados; é apenas o que você faz se tiver artigos de periódico.”

Links externos

Journal Article Tag Suite <https://jats.nlm.nih.gov/>

Standardized Markup for Journal Articles: Journal Article Tag Suite (JATS) <www.niso.org/standards-committees/jats>

 

Sobre Deborah Lapeyre

Deborah Lapeyre (juntamente com Tommie Usdin) atua como secretaria e principal arquiteta da JATS (ANSI NISO Z39.96-2015 Journal Article Tag Suite), bem como para dois conjuntos de tags baseados no JATS: BITS (Book Interchange Tag Suite) e NISO STS (American National Standard, STS: Standard Tag Suite, ANSI/NISO Z39.102-2017). A Sra. Lapeyre estava na equipe de design inicial da JATS e foi a desenvolvedora líder que criou a JATS a partir de um DTD de NLM mais antigo e a análise de mais de 45 conjuntos de etiquetas específicos para publishers. Atualmente trabalha como consultora sênior de XML para a Mulberry Technologies, Inc., uma empresa de consultoria especializada em ajudar seus clientes a melhor publicar através de soluções XML, XSLT e Schematron. Ela é professora e especialista em design de vocabulário XML com DTD e desenvolvimento de esquemas. Ela vem desenvolvendo sistemas que manipulam documentos etiquetados desde 1980, trabalhando com SGML desde antes que se tornasse um padrão internacional, e com XML e XSLT desde seu início.

 

Baseado em uma apresentação dada na Semana SciELO 20 Anos em setembro de 2018.

Traduzido do original em inglês por Lilian Nassi-Calò.

 

Como citar este post [ISO 690/2010]:

LAPEYRE, D.A. Introdução à JATS (Journal Article Tag Suite) [online]. SciELO em Perspectiva, 2018 [viewed ]. Available from: https://blog.scielo.org/blog/2018/10/31/introducao-a-jats-journal-article-tag-suite/

 

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Post Navigation