Por Fabiano Couto Corrêa da Silva
Introdução

Imagem: Hiroyuki Sen via Unsplash.
A integridade científica sempre foi um pilar fundamental da confiança pública na ciência. No entanto, vivemos um momento de crise sem precedentes, onde a escala, a sofisticação e a velocidade das fraudes científicas desafiam os mecanismos tradicionais de controle e verificação. A ascensão da inteligência artificial (IA) introduz uma complexidade inédita neste cenário: ao mesmo tempo que oferece ferramentas poderosas para a detecção de anomalias e fraudes, também barateia e escala a produção de conteúdo fraudulento de forma alarmante. Para a comunidade de editores, revisores e pesquisadores, esta é uma conversa de grande importância para a preservação da confiança na ciência como instituição social.
No livro Quem controla seus dados?1, argumento que a expansão da IA, aliada à concentração de plataformas e fluxos de dados, intensifica o colonialismo informacional e exige transparência, proveniência e uma governança soberana para salvaguardar a integridade científica.
A crise contemporânea e a industrialização da fraude científica
A integridade científica enfrenta uma crise de escala industrial. O fenômeno das paper mills (fábricas de artigos), verdadeiras produtoras de artigos fraudulentos, representa uma transformação qualitativa na natureza da má conduta científica. Não se trata mais de casos isolados de pesquisadores desonestos, mas de operações comerciais organizadas que produzem estudos falsos em massa para venda a pesquisadores pressionados pela lógica do “publicar ou perecer”.
Os números são alarmantes. Estudos recentes documentam um aumento exponencial no número de retrações de artigos científicos nas últimas duas décadas. Estimativas conservadoras sugerem que até 400.000 artigos fraudulentos infiltraram-se na literatura científica nas últimas duas décadas, enquanto apenas 7.275 retrações foram oficialmente registradas como relacionadas a essas organizações, revelando a magnitude oculta do problema.
Os números são alarmantes. Estudos recentes mostram que o número de retrações vem aumentando ao longo dos anos, ainda que represente uma proporção pequena do total de publicações, e que muitos artigos seguem recebendo um volume substancial de citações mesmo depois de retratados (2024)2. Ao mesmo tempo, análises sobre as paper mills indicam que organizações especializadas já conseguiram publicar muitos milhares de manuscritos fabricados em periódicos revisados por pares, comercializando autoria científica como um serviço (2024)3. Em conjunto, esses estudos sugerem que a má conduta científica não se restringe a casos isolados, mas assume formas estruturadas e de larga escala, com efeitos duradouros sobre a literatura científica.
A pandemia de COVID-19, com sua corrida desesperada por publicações, exacerbou dramaticamente este problema. Artigos sobre tratamentos milagrosos, dados fabricados sobre a eficácia de medicamentos e estudos com metodologias duvidosas inundaram as revistas científicas, muitos dos quais só foram retratados meses ou anos depois, quando o dano à saúde pública já havia sido feito.
Esta “industrialização da fraude” revela as fragilidades profundas de um sistema de avaliação por pares sobrecarregado e de um modelo de publicação que, por vezes, prioriza a quantidade em detrimento da qualidade. Revisores voluntários, muitas vezes trabalhando sem remuneração e sob pressão de tempo, não têm condições de detectar fraudes cada vez mais sofisticadas. Editoras, por sua vez, enfrentam o dilema entre manter a velocidade de publicação (e, consequentemente, suas receitas) e investir em verificações rigorosas que retardam o processo.
A Inteligência Artificial, faca de dois gumes
A IA generativa representa uma mudança de paradigma nesta crise. Se antes a fraude exigia um esforço considerável, como fabricar dados, manipular imagens, escrever textos coerentes, hoje é possível gerar conteúdo fraudulento com uma facilidade assustadora. Isto leva a uma tipologia expandida da má conduta científica, que vai muito além do plágio e da fabricação de dados tradicionais.
Geração de conteúdo fraudulento multimodal
A IA pode criar não apenas textos academicamente plausíveis, mas também imagens científicas falsas (como lâminas de microscópio, gráficos de experimentos, imagens de ressonância magnética), vídeos e até áudios de entrevistas ou depoimentos. Ferramentas de IA generativa podem produzir conjuntos de dados inteiros que parecem estatisticamente válidos, mas que são completamente fictícios. A sofisticação dessas fraudes torna a detecção extremamente difícil, mesmo para revisores experientes.
Implicações epistemológicas profundas
A própria natureza da evidência científica é questionada neste novo contexto. Se uma imagem pode ser gerada por IA de forma indistinguível de uma imagem real, como podemos confiar no que vemos? Se dados podem ser fabricados com distribuições estatísticas perfeitas, como distinguir o real do falso? A questão da autoria também se torna turva. Quem é o autor de um texto gerado com o auxílio de uma IA? O pesquisador que forneceu o prompt? A empresa que desenvolveu o modelo? A comunidade que gerou os dados de treinamento?
O Paradoxo da transparência
Como discutido no post O paradoxo da transparência no uso de IA generativa na pesquisa acadêmica4 publicado no próprio blog SciELO em Perspectiva, a declaração do uso de IA, embora eticamente recomendável e cada vez mais exigida por revistas científicas, pode levar a uma percepção de menor confiabilidade por parte dos leitores. Isto cria um dilema para os pesquisadores: ser transparente sobre o uso de ferramentas de IA pode prejudicar a recepção do trabalho, mas não declarar pode ser considerado má conduta. Este paradoxo revela a necessidade urgente de desenvolver novas normas e expectativas sobre o papel da IA na produção científica.
Ferramentas de detecção e a corrida armamentista tecnológica
Felizmente, a mesma tecnologia que potencializa a fraude também oferece novas ferramentas de defesa. A evolução dos paradigmas de detecção é constante, com o desenvolvimento de:
- Análise forense digital avançada — Técnicas sofisticadas para identificar manipulações em imagens e dados, incluindo análise de metadados, detecção de padrões anômalos de compressão e verificação de consistência estatística em datasets; conjuntos de dados.
- Análise linguística e estilométrica — Algoritmos capazes de detectar padrões textuais que sugerem a geração por IA, incluindo análise de coerência semântica, detecção de “alucinações” (informações plausíveis mas falsas geradas por modelos de linguagem) e identificação de estilos de escrita inconsistentes.
- Tecnologias emergentes: Blockchain e proveniência de dados — O blockchain, com sua capacidade de criar registros imutáveis e rastreáveis, está sendo explorado como uma forma de garantir a proveniência e a integridade dos dados de pesquisa. Sistemas de “timestamping” criptográfico podem comprovar quando dados foram coletados, por quem e sob quais condições, criando uma cadeia de custódia verificável.
Limitações e desafios
No entanto, nenhuma tecnologia é uma bala de prata. A corrida entre a fraude e a detecção é constante e assimétrica: enquanto os fraudadores precisam apenas encontrar uma brecha, os sistemas de detecção precisam ser abrangentes e infalíveis. Além disso, há o risco de falsos positivos, onde trabalhos legítimos são erroneamente sinalizados como fraudulentos, e de vieses algorítmicos, onde sistemas de detecção penalizam desproporcionalmente certos grupos de pesquisadores (por exemplo, não-anglófonos ou de instituições menos prestigiadas).
Dimensões éticas e sociais que colocam a confiança em jogo
O impacto final desta crise é a erosão da confiança pública na ciência. Cada fraude descoberta, cada escândalo de paper mill, cada retratação de alto perfil, mina a credibilidade de todo o sistema científico. Em um momento histórico em que enfrentamos desafios globais que exigem respostas baseadas em evidências, como as mudanças climáticas, pandemias, e desigualdades sociais, a perda de confiança na ciência é um risco existencial.
Esta crise também tem uma dimensão de colonialismo científico. As vulnerabilidades sistêmicas, como a pressão excessiva por publicação, a falta de recursos para verificação rigorosa e a dependência de plataformas e ferramentas proprietárias, afetam desproporcionalmente os pesquisadores e as instituições do Sul Global. Pesquisadores em países com menos recursos são mais vulneráveis às ofertas de paper mills, que prometem publicações rápidas em revistas aparentemente legítimas. Ao mesmo tempo, são frequentemente os primeiros a serem suspeitos quando fraudes são descobertas, reforçando estereótipos prejudiciais.
A responsabilidade, portanto, não pode ser apenas individual. Ela é institucional e sistêmica, exigindo uma transformação cultural profunda nas práticas de avaliação, incentivo e formação. Universidades e agências de fomento precisam repensar as métricas de sucesso acadêmico, valorizando a qualidade sobre a quantidade. Editoras precisam investir em processos de verificação mais robustos, mesmo que isso signifique publicar menos e mais devagar. E a comunidade científica como um todo precisa desenvolver uma cultura de transparência, reprodutibilidade e responsabilidade coletiva.
Por uma governança da Integridade Científica
Para enfrentar a crise de integridade na era da IA, não bastam soluções paliativas ou tecnológicas isoladas. É necessária uma governança integrada, que articule recomendações tecnológicas, reformas institucionais e, fundamentalmente, a cooperação internacional. A construção de um sistema científico íntegro e equitativo passa pela soberania científica, ou seja, pela capacidade de cada comunidade definir suas próprias regras e padrões de integridade, em diálogo com a comunidade global, sem imposições unilaterais de modelos desenvolvidos no Norte.
A transparência, a responsabilidade e a justiça epistêmica devem ser os pilares desta nova arquitetura de confiança. Este é um desafio que exige o engajamento de todos os atores do ecossistema científico: pesquisadores, editores, revisores, instituições, agências de fomento e a sociedade civil. A integridade científica não é apenas uma questão técnica ou ética individual, mas uma responsabilidade coletiva que define o futuro da ciência como instituição social.
Preservar a confiança na ciência é preservar a própria possibilidade de um futuro baseado em evidências, razão e justiça. Este é um momento crucial para reafirmar compromissos com uma ciência aberta, acessível e de qualidade, desenvolvendo práticas e políticas que garantam a integridade sem sacrificar a abertura, e que promovam a equidade sem comprometer o rigor.
Posts da série sobre o livro Quem controla seus dados?
- Colonialismo de Dados na Ciência: uma Nova forma de dominação epistêmica
- Ciência Aberta entre Promessas e Paradoxos, democratização ou nova dependência?
- Integridade Científica na era da IA: fraudes, manipulação e os novos desafios da transparência
- Soberania de Dados Científicos nas tensões entre a Abertura Global e a Autonomia Local
Notas
1. SILVA, F. C. C. Quem controla seus dados? Ciência Aberta, Colonialismo de Dados e Soberania na era da Inteligência Artificial e do Big Data. São Paulo: Pimenta Cultural, 2025. [viewed 10 December 2025]. https://10.31560/pimentacultural/978-85-7221-474-2. Available from: https://www.pimentacultural.com/livro/quem-controla-dados/ ↩
2. SCHMIDT, M. et al. Why do some retracted articles continue to get cited? Scientometrics [online]. 2024 vol. 129, pp. 7535–7563, ISSN:1588-2861 [viewed 10 December 2025] https://doi.org/10.1007/s11192-024-05147-4. Available from: https://link.springer.com/article/10.1007/s11192-024-05147-4 ↩
3. PARKER, L.; BOUGHTON, S.; BERO, L.; BYRNE, J. A. Paper mill challenges: past, present, and future. Journal of Clinical Epidemiology [online] 2024, v. 176 [viewed 10 December 2025] https://doi.org/10.1016/j.jclinepi.2024.111549. Available from: em: https://www.sciencedirect.com/science/article/pii/S0895435624003056 ↩
4. SAMPAIO, R. C. O paradoxo da transparência no uso de IA generativa na pesquisa acadêmica. Blog SciELO em Perspectiva, 2025 [viewed 10 December 2025]. Available from: https://blog.scielo.org/blog/2025/10/10/o-paradoxo-da-transparencia-no-uso-de-ia-generativa-na-pesquisa-academica/ ↩
Referências
PARKER, L.; BOUGHTON, S.; BERO, L.; BYRNE, J. A. Paper mill challenges: past, present, and future. Journal of Clinical Epidemiology [online] 2024, v. 176 [viewed 10 December 2025] https://doi.org/10.1016/j.jclinepi.2024.111549. Available from: em: https://www.sciencedirect.com/science/article/pii/S0895435624003056
SILVA, F. C. C. Quem controla seus dados? Ciência Aberta, Colonialismo de Dados e Soberania na era da Inteligência Artificial e do Big Data. São Paulo: Pimenta Cultural, 2025. [viewed 10 December 2025] https://10.31560/pimentacultural/978-85-7221-474-2. Available from: https://www.pimentacultural.com/livro/quem-controla-dados/
SCHMIDT, M. et al. Why do some retracted articles continue to get cited? Scientometrics [online]. 2024 vol. 129, pp. 7535–7563, ISSN:1588-2861 [viewed 10 December 2025] https://doi.org/10.1007/s11192-024-05147-4. Available from: https://link.springer.com/article/10.1007/s11192-024-05147-4.
Sobre Fabiano Couto Corrêa da Silva
Fabiano Couto Corrêa da Silva é pesquisador em Ciência da Informação, com foco em Ciência Aberta, colonialismo de dados e soberania informacional. Atua na intersecção entre estudos pós-coloniais, teoria crítica da informação e governança de dados. É autor do livro Quem controla seus dados? Ciência Aberta, Colonialismo de Dados e Soberania na era da Inteligência Artificial e do Big Data (Pimenta Cultural, 2025). Seus trabalhos examinam assimetrias de poder na comunicação científica e propõem caminhos para uma ciência mais justa e democrática. Lidera o DataLab – Laboratório de Dados, Métricas Institucionais e Reprodutibilidade Científica, com ênfase em FAIR/CARE.
Como citar este post [ISO 690/2010]:
















Últimos comentários