Por Deborah Lapeyre
A “JATS”, formalmente conhecida como ANSI/NISO Z39.96-2015 JATS: Journal Article Tag Suite, é um padrão internacional de conjunto de tags (etiquetas) XML para artigos de periódicos. A JATS é um vocabulário XML (semelhante ao propósito de outros vocabulários XML baseados em documentos, como DocBook ou TEI) desenvolvido para modelar artigos de periódicos atuais. A JATS é uma coleção com nomes de elementos e atributos XML que podem ser usados para marcar a estrutura e a semântica de um artigo individual de periódico. Assim, a JATS não modela coleções de periódicos, livros, corpus em um idioma, patentes, legislação, padrões ou outros tipos de documentos. Originalmente, a JATS era usada para artigos STEM (do inglês, Ciência, Tecnologia, Engenharia e Medicina), mas agora os periódicos nas áreas de humanidades, sociologia, economia e ciências sociais também utilizam a marcação XML da JATS.
A JATS possui três modelos separados, destinados a públicos distintos:
- Modelo de Arquivamento e Intercâmbio (menos restrito, para bibliotecas e arquivos incorporarem XML em seus repositórios);
- Modelo de Publicação de Artigos de Periódico (mais restrito, para produção de publicações, normalmente usados por publishers, plataformas de hospedagem e portais);
- Modelo de Autoria de Artigo (projetado para os autores do artigo).
Objetivo Original da JATS
A JATS foi originalmente construída para intercambiar artigos de periódicos, proporcionando interoperabilidade de conteúdo de artigos e metadados de artigos entre publishers e arquivos. No início, esperava-se que os publishers, hosters, portais e arquivos usassem seu próprio conjunto de tags XML internamente e se transformassem em XML JATS quando desejassem:
- trocar informações entre si;
- colocar informações em um repositório combinado;
- vender/exibir itens na mesma plataforma de hospedagem; e/ou
- compartilhar o desenvolvimento de ferramentas e recursos para uso comum.
O mundo publica artigos de periódico em JATS
Entretanto, desde que a JATS foi lançada em fevereiro de 2003, muitos publishers consideraram a JATS útil para os testes de produção e Garantia da Qualidade de artigos e preprints. Embora a JATS ainda seja amplamente usada para construir grandes repositórios de periódicos e para o intercâmbio entre organizações, os publishers também estão produzindo seu novo conteúdo em JATS. Os maiores publishers ainda usam seus próprios conjuntos de etiquetas, mas os publishers de pequeno e médio porte estão codificando seus novos periódicos em JATS e convertendo seus backfiles a partir do PDF ou um conjunto de tags proprietárias em JATS. Arquivos públicos, como bibliotecas e portais acadêmicos, acham conveniente receber dados de artigos de várias fontes em um único formato. Arquivos privados e comerciais podem requerer a JATS para serem ingressados, ou podem transformar qualquer formato que eles recebam em JATS para seu site/repositório/aplicativo.
Inúmeros fornecedores de hospedagem e de serviços na web requerem ou admitem JATS. As transformações públicas e gratuitas fazem que Crossref deposite arquivos a partir da JATS. Comunidades inteiras concordaram com um formato de dados para conteúdo de periódicos.
A JATS está em uso em mais de 25 países em todo o mundo, incluindo: Austrália, Bélgica, Brasil, Bulgária, Canadá, Chile, Egito, Finlândia, França, Alemanha, Itália, Japão, Noruega, Rússia, Coréia do Sul, Suécia, Suíça, Emirados Árabes Unidos, Reino Unido e Estados Unidos. A maioria dos pequenos e médios publishers na América do Norte e Europa utiliza JATS, com muitos países asiáticos e da América do Sul produzindo pelo menos alguns periódicos em JATS. Todos os publishers realmente grandes (que usam seus próprios modelos de periódico internamente) podem (e usam) JATS para intercâmbio e depósito. Muitos arquivos públicos e privados aceitam (ou requerem) JATS, incluindo: PubMed Central (EUA e Reino Unido), Biblioteca Nacional Britânica, Biblioteca Nacional Australiana, Biblioteca do Congresso dos EUA, Portico/ITHAKA/JSTOR, e muitos outros.
Os fornecedores de conversão em todo o mundo desenvolveram processos e ganharam experiência significativa na conversão para dentro e fora da JATS. Usar um conjunto de tags compartilhadas significa que os fornecedores de conversão não precisam aprender/personalizar um conjunto de tags de periódico para cada editor. Foram desenvolvidas ferramentas para criar a JATS a partir de vários formatos, incluindo Microsoft Word e LaTeX, e para criar PDF, HTML (HTML, XHTML, HTML5) de qualidade, vários formatos acessíveis e e-books a partir da JATS.
Estrutura de um artigo em JATS
Por design, a JATS modela o que os publishers de periódicos já estão fazendo. Quando a JATS foi projetada, centenas de periódicos foram examinados quanto à estrutura e metadados e mais de 45 modelos existentes de periódico XML e SGML foram examinados. Os designers tentaram o caso 80/20; ou seja, se 80% dos periódicos marcaram os dados de maneira semelhante, a JATS também escolheu estes elementos, mesmo que os projetistas do JATS considerassem que poderiam imaginar uma maneira melhor de marcar o material. Para os 20% não abordados explicitamente, as tramas de escape da marcação foram adicionadas à JATS: um elemento contentor de nome-valor para os metadados, um elemento in-line de conteúdo nomeado para capturar a marcação semântica específica do publisher e um elemento de conteúdo com estilo para registrar distinções não semânticas in-line de look-and-feel. A intenção das estruturas semânticas específicas do publisher (como as Declarações de Disponibilidade de Dados) pode ser capturada com atributos de classificação de informação.
A JATS tenta não liderar ou coagir publishers, porém capturar práticas comuns de periódicos. A JATS preserva a ordem de texto atual (sequência de leitura) tanto quanto possível e normalmente não define ou estabelece “Boas Práticas”.
A ideia é que seja o mais simples possível codificar os artigos de periódicos de qualquer pessoa em JATS. Para tornar isso mais fácil, a JATS é um modelo de documento à moda antiga, com metadados referentes ao artigo (e ao periódico, se apropriado) no início e no corpo e na parte final do artigo, após os metadados. Este modelo (mostrado abaixo em forma resumida) se encaixa na produção atual de periódicos.
- Front Matter (<front>)
- Metadados a nível do periódico (título do periódico e identificadores);
- Metadados a nível do artigo (título do artigo, autor(es), identificadores como DOI).
- Body Matter (<body>)
O texto da narrativa do artigo, incluindo, por exemplo:- Parágrafos;
- Seções;
- Figuras e gráficos;
- Tabelas (XHTML e CALS);
- Equações e citações.
- Back Matter (<back>)
- Apêndices;
- Lista de referências bibliográficas com informação detalhada (porém totalmente opcional), metadados de citação.
Metadados para busca, mineração e extração
Além de marcar a estrutura de um artigo, a JATS pode (sempre de forma opcional) fornecer metadados ricos necessários para intercâmbio semântico, pesquisa sensível ao contexto e mineração de dados. Os extensos metadados descritíveis na JATS viajam com o artigo XML, não bloqueados em um arquivo ou banco de dados separado. Por exemplo, a JATS pode incluir muitos identificadores externos processáveis por máquina, tais como:
- Identificadores de componentes de artigos e artigos, como DOIs e números arXiv;
- Identificadores de autor, como ORCIDs;
- Identificadores da instituição (por exemplo, Ringgold, ISNI); e
- Identificadores do financiador.
Metadados a nível do artigo para citação do artigo e crédito aos autores podem incluir:
- Título do artigo (com idiomas alternativos, se desejado);
- Identificadores de artigos (DOI, identificadores de publishers, etc.);
- Direitos autorais e permissões;
- Múltiplos resumos (para capturar resumos de seções, resumos gráficos, resumos estereoquímicos, resumos do Twitter, resumos de RSS/Atom e resumos de parágrafos comuns);
- Encontrar ajuda como palavras-chave, termos e classificações de assunto (que podem ser em vários idiomas e ligados a ontologias/taxonomias); e
- Descrições detalhadas do financiamento por trás da pesquisa sobre a qual o artigo reporta, incluindo:
- Fontes de financiamento monetário e não monetário;
- Identificadores de bolsas e doações;
- Fontes de financiamento e princípios.
- Links para artigos ou recursos complementares (versões em diferentes idiomas, erratas, atualizações, livros relacionados ou páginas web).
Os colaboradores na redação e na pesquisa detrás de um artigo não são os únicos autores e publishers normalmente citados nos artigos hoje em dia. Os colaboradores também podem ser fotógrafos, designers do estudo, curadores, sequenciadores de genoma, colecionadores de espécimes, artistas de visualização e outras funções mencionadas. O material que a JATS pode registrar referente a um colaborador pode incluir:
- Identificadores externos únicos;
- A capacidade de registrar iniciais e nomes completos;
- A capacidade de ter apenas um determinado nome, sem um sobrenome, como é o costume em alguns países do sudeste asiático;
- Nomes alternativos para um indivíduo (caracteres japoneses e uma versão romanizada, por exemplo);
- Descrição do papel ou papéis desempenhados pela pessoa (possivelmente ligados a termos de taxonomia do CRediT);
- Várias afiliações (com nomes alternativos para vários idiomas).
Referências bibliográficas detalhadas para um artigo permitir o rastreamento de publicações e ajudar a estabelecer relevância científica por meio de citações. Os componentes nomeados de uma referência permitem que o software verifique referências no Crossref, no Figshare ou outro repositório DOI para melhorar a precisão de referência. A JATS pode suportar praticamente qualquer tipo e estilo de marcação de referência, incluindo citação de dados (com tempos de acesso). Para citar artigos de periódicos, os elementos específicos incluem nomes dos contribuintes, título do artigo, título e edição do periódico, números da primeira e da última página, dia-mês-ano de publicação, DOI e mais. Da mesma forma, a JATS nomeou elementos suficientes para citar livros, patentes, documentos de conferências, padrões e outros trabalhos.
Vantagens da JATS para artigos de periódicos
Porque você deveria considerar o JATS se você produz de artigos de periódicos?
Declarativo: A marcação JATS é estrutural ou semântica e declarativa, não de apresentação ou comportamento. Isso torna os artigos mais fáceis de processar e ajuda a garantir dados de maior durabilidade.
Desenhado para artigos: A JATS é um modelo XML que se enquadra na forma como periódicos (e preprints) são publicados hoje em dia.
O conjunto de etiquetas está documentado: As Extensive Tag Libraries com explicações e exemplos para o uso de elementos e atributos estão disponíveis on-line, assim como recomendações sobre Boas Práticas.
O preço é justo: Conjuntos de tags – tag sets – (em formato DTD, XSD e RNG), documentação de biblioteca de etiquetas (Tag Library documentation), exemplos de tags, e algumas ferramentas para controle de qualidade e produção de conteúdo estão disponíveis gratuitamente em:
- Biblioteca Nacional de Medicina dos EUA (NLM) <https://jats.nlm.nih.gov/> e
- Github (JATS4R, eLife, et al.)
Alta e facilmente personalizável: A JATS foi desenhada para ser estendida e ampliada muito facilmente. Os mecanismos de extensão incorporados estão documentados nas Tag Libraries (bibliotecas de tags).
Não é um padrão estático: A JATS evolui na medida em que publishers e outros usuários requisitam novas funcionalidades ou modificações. Seus comentários podem ser submetidos em <www.niso.org/standards-committees/jats>.
Em suma, a JATS não é nova, sexy ou empolgante, mas é extremamente útil no mundo editorial. Nas palavras de Jeff Beck (do PubMed Central):
“A JATS não é mais um dos jovens descolados; é apenas o que você faz se tiver artigos de periódico.”
Links externos
Journal Article Tag Suite <https://jats.nlm.nih.gov/>
Standardized Markup for Journal Articles: Journal Article Tag Suite (JATS) <www.niso.org/standards-committees/jats>
Sobre Deborah Lapeyre
Deborah Lapeyre (juntamente com Tommie Usdin) atua como secretaria e principal arquiteta da JATS (ANSI NISO Z39.96-2015 Journal Article Tag Suite), bem como para dois conjuntos de tags baseados no JATS: BITS (Book Interchange Tag Suite) e NISO STS (American National Standard, STS: Standard Tag Suite, ANSI/NISO Z39.102-2017). A Sra. Lapeyre estava na equipe de design inicial da JATS e foi a desenvolvedora líder que criou a JATS a partir de um DTD de NLM mais antigo e a análise de mais de 45 conjuntos de etiquetas específicos para publishers. Atualmente trabalha como consultora sênior de XML para a Mulberry Technologies, Inc., uma empresa de consultoria especializada em ajudar seus clientes a melhor publicar através de soluções XML, XSLT e Schematron. Ela é professora e especialista em design de vocabulário XML com DTD e desenvolvimento de esquemas. Ela vem desenvolvendo sistemas que manipulam documentos etiquetados desde 1980, trabalhando com SGML desde antes que se tornasse um padrão internacional, e com XML e XSLT desde seu início.
Baseado em uma apresentação dada na Semana SciELO 20 Anos em setembro de 2018.
Traduzido do original em inglês por Lilian Nassi-Calò.
Como citar este post [ISO 690/2010]:
O formato XML é muito versátil e se mostra uma excelente opção para formatação de artigos científicos.