Por Amanda Ramalho e Toby Steiner

Foto: Amanda Ramalho.
No início de dezembro, ocorreu a FIL Guadalajara 20251(Feira Internacional del Libro 2025), um dos principais eventos internacionais do setor editorial latino-americano. Entre as diversas atividades profissionais da feira, mereceu destaque o Encuentro de Editores Universitários Iberoamericanos, do qual participou a Thoth Open Metadata, reunindo editoras universitárias, pesquisadores e representantes de infraestruturas editoriais para discutir os desafios e oportunidades da publicação acadêmica na região.
Ao longo do encontro, foram abordados temas como comunicação editorial, avaliação científica responsável, multilinguismo e a criação do Conselho Ibero-Americano de Publicações Universitárias e Acadêmicas. Neste contexto, um painel se concentrou na apresentação dos resultados da primeira fase do projeto Radiografías de la edición académica iberoamericana, uma iniciativa coletiva que busca mapear a produção, circulação e visibilidade dos livros acadêmicos na região.
Quando os livros são desprovidos de dados, eles não têm visibilidade
A análise apresentada pelo projeto Radiografías2destacou questões estruturais recorrentes relacionadas à gestão editorial da informação. Entre os principais problemas identificados estão a inconsistência dos metadados, a falta de informação essencial, a fragmentação dos dados em vários sistemas e a baixa interoperabilidade entre plataformas.
Os resultados preliminares apontam para três desafios principais:
- Fragmentação de dados: a ausência de sistemas padronizados dificulta o compartilhamento, a integração e a descoberta de conteúdo acadêmico.
- Inconsistência dos metadados: alta porcentagem de informação incompleta ou ausente, como autoria, afiliações institucionais, tipos de trabalho, identificadores persistentes (DOI, ISBN), informação sobre direitos e canais de acesso.
- Baixa interoperabilidade: a falta de padrões comuns impede que os livros circulem de forma eficiente entre bibliotecas, indexadores, plataformas de acesso aberto e sistemas de avaliação.
Na prática, este cenário significa que muitos livros acadêmicos permanecem invisíveis para:
- sistemas de descoberta de bibliotecas;
- agregadores e serviços de indexação;
- sistemas de informação científica;
- e, acima de tudo, nos processos de avaliação de pesquisa.
O debate deixou claro que, no contexto atual, a visibilidade dos livros acadêmicos não depende apenas de serem publicados, mas da capacidade de seus metadados circularem de maneira estruturada, interoperável e reutilizável em diferentes ecossistemas de comunicação científica.
Metadados como infraestrutura institucional
Um dos pontos-chave destacados na mesa redonda foi a necessidade de entender os metadados como uma responsabilidade institucional, em vez de apenas uma tarefa técnica ou auxiliar. As decisões sobre como os metadados são criados, armazenados e compartilhados afetam diretamente a autonomia dos editores, sua sustentabilidade a longo prazo e sua capacidade de integrar infraestruturas abertas de comunicação científica.
A partir desta perspectiva, os metadados abertos não representam uma posição ideológica, porém uma escolha de governança. Manter os registros bibliográficos sob controle institucional permite:
- Garantir a propriedade e a integridade dos dados
- Reduzir a dependência de sistemas proprietários
- Garantir a consistência entre os diferentes canais de divulgação
- Participar de ecossistemas cooperativos e não exclusivos
Além das plataformas: por que a interoperabilidade é importante
Publicar um livro de acesso aberto por si só não é suficiente para garantir sua visibilidade e circulação, nem para garantir sua descoberta, se os dados associados estiverem incompletos, inconsistentes ou isolados em silos técnicos.
O que o ecossistema editorial ibero-americano exige cada vez mais são camadas de infraestrutura capazes de:
- Adotar padrões amplamente utilizados, como ONIX, MARC e KBART.
- Permitir a troca automatizada de dados por meio de APIs.
- Permitir o fluxo simultâneo de metadados para vários destinos.
Neste contexto, a interoperabilidade não é mais um diferencial, mas um requisito básico para o reconhecimento de livros acadêmicos.
Quem é responsável pelos dados?
Os dados apresentados pelo Radiografías revelam uma fraqueza central na publicação acadêmica ibero-americana: a ausência de dados abertos estruturados e consistentes na fonte.
No ecossistema editorial, cada ator desempenha um papel específico. As agências ISBN registram informação, os distribuidores as compartilham e os agregadores as indexam. A qualidade dos metadados, no entanto, depende fundamentalmente de sua criação no ponto de origem: as editoras. É neste ponto que a consistência, a integridade e a padronização dos dados podem ser garantidas de forma duradoura.
A alta porcentagem de informação indisponível identificada pelo Radiografías, como lacunas na autoria, afiliações, identificadores persistentes e informação sobre direitos, nem sempre estão relacionadas à falta de comprometimento por parte das editoras ou à ausência de equipes qualificadas. Em muitos casos, se trata de limitações estruturais associadas à falta de infraestrutura adequada para o gerenciamento de metadados em todo o fluxo editorial. Além disso, a qualidade dos dados se deteriora ao longo de seu percurso por diferentes sistemas de intermediários, e barreiras artificiais à reutilização posterior (por exemplo, por bibliotecas) estão sendo introduzidas por certos intermediários por meio da aplicação de direitos autorais restritivos.
Como o Thoth Open Metadata e o SciELO Livros se conectam a este desafio
As discussões em Guadalajara apontaram para a importância de soluções que integrem padrões, governança e a circulação efetiva de dados como elementos estruturais da publicação acadêmica.
É precisamente aí que o Thoth Open Metadata e o SciELO Livros se conectam, oferecendo infraestruturas abertas e convergentes que respondem ao mesmo desafio estrutural: na ausência de dados consistentes e abertos, os livros acadêmicos não circulam.
SciELO Livros: uma infraestrutura pública para livros acadêmicos
Há mais de 28 anos, o Programa SciELO consolidou uma infraestrutura robusta para periódicos científicos, baseada na padronização editorial, preservação digital, interoperabilidade internacional e uma cadeia completa de metadados integrada ao seu banco de dados bibliométrico. Com o tempo, esta experiência revelou uma assimetria estrutural: enquanto as revistas tinham uma infraestrutura consolidada, os livros acadêmicos permaneciam sem um ecossistema equivalente. Até o início da década de 2010, os livros acadêmicos eram publicados principalmente em formato impresso e, mesmo quando disponibilizados em PDF, isso ocorria sem tratamento estruturado dos textos completos ou metadados capazes de garantir interoperabilidade, rastreabilidade e circulação internacional. O resultado foi a fragmentação da informação, baixa visibilidade e dificuldade em inserir os livros nos sistemas de descoberta e avaliação científica.
Em 2012, foi lançada a coleção SciELO Livros, adaptando a mesma lógica de padrões, critérios e metadados estruturados já aplicados aos periódicos científicos aos livros acadêmicos. Em 2025, iniciou-se uma nova fase com a expansão para a Rede SciELO Livros, cuja primeira coleção em desenvolvimento foi o SciELO Livros México. Durante a FIL Guadalajara 2025, foi anunciado também o início do desenvolvimento da coleção SciELO Livros Peru, expandindo este modelo para uma escala latino-americana e ibero-americana.
Atualmente, o SciELO Livros opera em seis frentes principais, em cooperação com as editoras acadêmicas participantes:
- Registro principal por livro e por capítulo
- Produção de EPUBs acessíveis, seguindo requisitos de acessibilidade e consistência técnica
- Registro e gerenciamento de DOI para livros e capítulos, com verificação antes da publicação
- Revisão da consistência entre os ISBNs e os dados apresentados nos arquivos finais
- Exportação automatizada de metadados em formatos como ONIX e KBART
- Preservação digital, garantindo manutenção e disponibilidade a longo prazo
Thoth: promovendo a autonomia das editoras
Ao mesmo tempo, no contexto europeu, o projeto COPIM3 chegou a uma conclusão semelhante a partir de uma perspectiva diferente: muitas editoras acadêmicas, especialmente as de pequeno e médio porte, careciam de ferramentas abertas e sustentáveis para criar, gerenciar e distribuir metadados de maneira padronizada. A resposta a este desafio foi o desenvolvimento de um sistema de divulgação aberto, agora chamado Thoth, projetado como uma infraestrutura aberta e baseada na comunidade para o gerenciamento e a circulação de metadados editoriais, sem dependência de plataformas proprietárias.
Thoth oferece:
- Gerenciamento completo: metadados registrados em um formato padronizado, sob o controle da própria editora, garantindo acesso e compartilhamento completos e auditáveis
- Exportação estruturada em vários formatos: mais de 15 formatos disponíveis para download gratuito, incluindo ONIX, MARC, KBART, XML para Crossref e esquemas de distribuição específicos para plataformas personalizadas
- Interoperabilidade por meio de APIs abertas: bibliotecas, repositórios, distribuidores, portais institucionais e painéis podem consumir metadados diretamente da plataforma, sem intermediários, por meio de duas APIs abertas dedicadas e um ponto de acesso OAI-PMH
- Plugin OMP para exportar metadados diretamente para o Thoth
A Thoth Open Metadata, organização sem fins lucrativos responsável pelo desenvolvimento e manutenção do sistema Thoth, também oferece serviços opcionais, como distribuição automatizada, hospedagem de sites e catálogos, criação de catálogos personalizados, fornecimento de estatísticas de uso em todas as plataformas e integração com os sistemas próprios das editoras.
No final do primeiro trimestre de 2026, o Thoth Open Metadata lançará uma reformulação completa4 do sistema com uma interface multilíngue em espanhol e português, metadados multilíngues, metadados de acessibilidade e melhorias nas APIs e nos fluxos de ingestão e distribuição.
O Thoth contribui com autonomia, portabilidade, transparência e escalabilidade para as editoras, posicionando-se como uma infraestrutura complementar às plataformas de publicação e divulgação existentes.
Construindo o futuro
Os debates apresentados ao longo desta publicação no blog convergem para uma conclusão central: a circulação de livros acadêmicos depende cada vez mais da capacidade das editoras de manter um controle eficaz sobre os dados que descrevem sua produção editorial.
Ter acesso total aos seus próprios metadados, de forma aberta, estruturada, exportável e auditável, não é mais um detalhe técnico, mas se tornou um elemento estratégico da publicação acadêmica. Quando os dados existem apenas em plataformas de terceiros, as editoras perdem visibilidade, rastreabilidade e autonomia sobre como seus livros são representados em bibliotecas, bases de dados e sistemas de descoberta científica.
Neste contexto, algumas questões se tornam inevitáveis para as editoras universitárias:
- É possível exportar todos os metadados em formatos padrão, sempre que necessário?
- Existe acesso ao histórico completo dos registros editoriais?
- É possível auditar qual informação está sendo enviadas para bibliotecas, agregadores e serviços de indexação?
- Os dados podem ser baixados na íntegra, a qualquer momento, sem depender de fornecedores específicos?
A capacidade de responder afirmativamente a estas perguntas é o que define, na prática, os metadados genuinamente abertos. Não como uma posição ideológica, mas como uma necessidade editorial e institucional. À luz do diagnóstico apresentado pelo projeto Radiografías de la edición académica iberoamericana, três linhas de ação se destacam como fundamentais para que os livros acadêmicos circulem de forma mais ampla, consistente e sustentável:
- Gestão estruturada de catálogos: cada editora precisa de um registro mestre para cada obra, capaz de vincular edições, formatos e canais de distribuição ao longo do tempo.
- Metadados verdadeiramente abertos: dados sob controle institucional, exportáveis, reutilizáveis e auditáveis, independentemente das plataformas comerciais.
- Adoção de padrões compartilhados: ONIX para marketing, MARC para bibliotecas e KBART para bancos de dados não são opcionais: são a língua franca do ecossistema editorial.
Os dados produzidos pelo projeto Radiografías oferecem um diagnóstico preciso. O desafio agora é coletivo e voltado para o futuro: qual infraestrutura será construída para que, nos próximos anos, estas lacunas deixem de existir?
A qualidade editorial dos livros acadêmicos está diretamente ligada à qualidade dos dados que os descrevem e a qualidade destes dados depende das escolhas de infraestrutura feitas hoje.
Notas
1. Feria Internacional del Libro de Guadalajara (FIL Guadalajara) [online]. FIL Guadalajara. 2025 [viewed 30 January 2026]. Available from: https://www.filguadalajara.com/↩
2. MÉNDEZ-RÁTIVA, C. P.; CÓRDOBA-RESTREPO, J. F.; MORALES-PERDOMO, T.; TORRES-TORRES, I.; GARZÓN-FORERO, D. A. Redes de comunicación y colaboración científica: caso de estudio de la Editorial Universidad del Rosario. Revista Española de Documentación Científica [online]. 2025, vol. 48, no. 2, pp. 1600-1600 [viewed 30 January.2026]. https://doi.org/10.3989/redc.2025.2.1600. Available from: https://redc.revistas.csic.es/index.php/redc/article/view/1600↩
3. Community-led Open Publication Infrastructures for Monographs (COPIM) [online]. Copim. 2019–2023 [viewed 30 January. 2026]. Available from: https://copim.pub/projects/copim-2019-2023/↩
4. Announcing a Major Update to the Thoth Platform [online]. Thoth Open Metadata. 2025 [viewed 30 January. 2026]. Available from: https://thoth.pub/blog/10.70950/gfsb5419/↩
Referências
Announcing a Major Update to the Thoth Platform [online]. Thoth Open Metadata. 2025 [viewed 30 January 2026]. Available from: https://thoth.pub/blog/10.70950/gfsb5419/
Community-led Open Publication Infrastructures for Monographs (COPIM) [online]. Copim. 2019–2023 [viewed 30 January 2026]. Available from: https://copim.pub/projects/copim-2019-2023/
Feria Internacional del Libro de Guadalajara (FIL Guadalajara) [online]. FIL Guadalajara. 2025 [viewed 30 January 2026]. Available from: https://www.filguadalajara.com/
MÉNDEZ-RÁTIVA, C. P.; CÓRDOBA-RESTREPO, J. F.; MORALES-PERDOMO, T.; TORRES-TORRES, I.; GARZÓN-FORERO, D. A. Redes de comunicación y colaboración científica: caso de estudio de la Editorial Universidad del Rosario. Revista Española de Documentación Científica [online]. 2025, vol. 48, no. 2, pp. 1600-1600 [viewed 30 January 2026]. https://doi.org/10.3989/redc.2025.2.1600. Available from: https://redc.revistas.csic.es/index.php/redc/article/view/1600
RAMALHO, A.; STEINER, T. What the FIL Guadalajara debates reveal about metadata for academic books and how Thoth Open Metadata and SciELO Books respond to this challenge [online]. Thoth Open Metadata, 2025 [viewed 30 January 2026]. https://doi.org/10.70950/sfsv8305. Available from: https://thoth.pub/blog/10.70950/sfsv8305
Links externos
Traduzido do original em inglês por Lilian Nassi-Calò.
Como citar este post [ISO 690/2010]:















Últimos comentários