{"id":846,"date":"2014-03-31T14:51:26","date_gmt":"2014-03-31T17:51:26","guid":{"rendered":"http:\/\/blog.scielo.org\/es\/?p=846"},"modified":"2019-05-02T14:44:35","modified_gmt":"2019-05-02T17:44:35","slug":"al-principio-eran-los-plagios-ahora-tambien-los-papers-automaticos-falsos","status":"publish","type":"post","link":"https:\/\/blog.scielo.org\/es\/2014\/03\/31\/al-principio-eran-los-plagios-ahora-tambien-los-papers-automaticos-falsos\/","title":{"rendered":"Al principio eran los plagios, ahora tambi\u00e9n los &#8216;papers&#8217; autom\u00e1ticos falsos"},"content":{"rendered":"<p>En d\u00edas recientes han aparecido algunos art\u00edculos en la prensa que dan la impresi\u00f3n que el sistema editorial acad\u00e9mico est\u00e1 siendo inundado por trabajos falsos creados por programas de computaci\u00f3n y presentados en conferencias. La informaci\u00f3n original fue publicada por el art\u00edculo <i>Publishers withdraw more than 120 gibberish papers<\/i>\u00b9, publicada en <i>Nature<\/i> el 24 de febrero, del cual se hizo eco r\u00e1pidamente <i>The Guardian<\/i> en el art\u00edculo <i>How computer-generated fake papers are flooding academia<\/i>\u00b2; otros medios de prensa en los siguientes d\u00edas publicaron comentarios sobre el asunto (Scientific American, Reddit, etc).<\/p>\n<p>La noticia caus\u00f3 impacto porque estos trabajos falsos, creados autom\u00e1ticamente por un programa de computaci\u00f3n, hab\u00edan sido aceptados por editoriales prestigiosas, 16 de \u00e9stos por la editora alemana Springer, y m\u00e1s de 100 fueron publicados por el <i>Institute of Electrical and Electronic Engineers<\/i> (IEEE) en los Estados Unidos. Pero, en realidad, nada de esto deber\u00eda impresionarnos, en Internet existe el <i>spamming<\/i>, \u00bfcierto?, pues tambi\u00e9n existe en la publicaci\u00f3n cient\u00edfica. Para explicar mi punto de vista voy a contar qu\u00e9 hice cuando le\u00ed el art\u00edculo de <i>Nature<\/i>, e invito a los lectores a hacer lo mismo porque fue una experiencia muy entretenida.<\/p>\n<p>La noticia de <i>Nature<\/i> nos dec\u00eda que los trabajos falsificados hab\u00edan sido creados por un programa llamado <i>SCIgen \u2013 An automatic CS Paper generato<\/i>r\u00b3, desarrollado en el MIT por tres estudiantes graduados en el a\u00f1o 2005, que produce papers inventados, pero con excelente redacci\u00f3n y manteniendo estrictamente el formato cient\u00edfico. De acuerdo a la presentaci\u00f3n que hacen los mismos autores del programa:<\/p>\n<p style=\"padding-left: 30px;\">SCIGEN es un programa que genera documentos aleatorios de investigaci\u00f3n en Ciencias de la Computaci\u00f3n, incluyendo gr\u00e1ficos, figuras y referencias bibliogr\u00e1ficas. Utiliza una gram\u00e1tica libre de contexto escrita a mano para formar todos los elementos de los documentos. Nuestro objetivo es maximizar la diversi\u00f3n, en lugar de la coherencia\u00b3. (Traducci\u00f3n libre)<\/p>\n<p>El programa SCIgen creado en 2005 en el MIT, fue analizado por un investigador franc\u00e9s, Cyril Labb\u00e9, del Laboratorio de Inform\u00e1tica de la Universidad de Grenoble quien cre\u00f3 el programa antiScigen y luego public\u00f3 en 2012 un trabajo en Scientometrics\u2074 sobre los <i>papers<\/i> falsos generados por computadora. Cyril Labb\u00e9 tambi\u00e9n en 2010 demostr\u00f3 la vulnerabilidad de los c\u00e1lculos del \u00edndice-h basados en el Google Acad\u00e9mico aliment\u00e1ndolo con m\u00e1s de 100 trabajos generados por SCIgen que se citaban entre s\u00ed, y usando este m\u00e9todo consigui\u00f3 clasificar a \u201cIke Antkare\u201d (autor inventado) como el m\u00e1s citado en la historia.<\/p>\n<p>Entonces yo mismo hice una prueba. Ingres\u00e9 al sitio, <i>SCIgen\u00b3<\/i> y en el formulario que dice \u201c<i>Generate a Random Paper<\/i>\u201d, ingres\u00e9 como autoras a varias de mis bibliotecarias amigas. Hice tres <i>papers<\/i>, combinando diferentes autoras, todo lo que me llev\u00f3 menos de 5 minutos. Luego gener\u00e9 los PDFs de esos trabajos y los baj\u00e9 a mi computadora para revisar. Formalmente irreprochables. Hasta la bibliograf\u00eda estaba correctamente construida, que amablemente inclu\u00eda en algunas de las referencias bibliogr\u00e1ficas a mis amigas bibliotecarias como autoras!!!<\/p>\n<p>Preparados los trabajos falsos segu\u00ed adelante en mi investigaci\u00f3n y proced\u00ed a enviar estos tres <i>papers<\/i> de mis amigas bibliotecarias para que fueran revisados por el \u201cantiScigen\u201d. Ingres\u00e9 en la p\u00e1gina AntiScigen\u2075, lo \u00fanico que requiere es que el paquete de archivos PDFs sean enviados como un archivo .zip. As\u00ed lo hicimos y en dos minutos vino el reporte en forma gr\u00e1fica que se ve en la imagen adjunta. En el gr\u00e1fico aparecen tres \u00e1rboles:<\/p>\n<ul>\n<li>En negro las secciones de texto singular (no responde a <i>fingerprints<\/i> conocidos);<\/li>\n<li>En rojo secciones de texto que son reconocidas como producidas por SCIgen;<\/li>\n<li>En azul secciones de texto que han sido copiadas de otros textos del campo de la computaci\u00f3n, pero no generadas por el programa.<\/li>\n<\/ul>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-847\" src=\"http:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2014\/03\/papers-automaticos.png\" alt=\"\" width=\"547\" height=\"507\" srcset=\"https:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2014\/03\/papers-automaticos.png 547w, https:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2014\/03\/papers-automaticos-300x278.png 300w\" sizes=\"auto, (max-width: 547px) 100vw, 547px\" \/><\/p>\n<p>En menos de 10 minutos pudimos crear tres trabajos acad\u00e9micos, y luego verificarlos con el programa antiScigen. Parece simple, \u00bfverdad?<\/p>\n<p>Nada de esto es nuevo en el \u00e1rea de las Ciencias de la Computaci\u00f3n. Hoy d\u00eda, con buena o mala fe, hay gran cantidad de imitadores que manipulan trabajos, crean perfiles falsos en <i>Google Scholar Citations<\/i>, y luego manipulan las cifras. No solamente se fabrican <i>papers<\/i> de conferencias, sino todo tipo de otros trabajos. Como ejemplo de generadores similares tenemos los dos siguientes, y vale la pena que haga su experiencia para evaluar.<\/p>\n<ul>\n<li>Generador de ensayos acad\u00e9micos<sup>6<\/sup>;<\/li>\n<li>Generador de propuestas de financiaci\u00f3n<sup>7<\/sup>.<\/li>\n<\/ul>\n<p>Pero el que considero m\u00e1s sorprendente de todos es el que hizo Philip Parker, que en su peque\u00f1a compa\u00f1\u00eda con la ayuda de unas computadoras y programadores, escribi\u00f3 200.000 libros y los vende en Amazon. Parker produce un libro cada 20 minutos por un procedimiento patentado.<\/p>\n<p>Pues bien, el <i>spamming<\/i> ha ingresado al mismo coraz\u00f3n de la ciencia. Como dice el art\u00edculo de Nature, nos da igual que los <i>papers<\/i> se sometan a un mundo controlado (editoriales y revistas de prestigio y con sistemas de revisi\u00f3n por pares) o se env\u00eden a entornos m\u00e1s o menos controlados, o abiertamente incontrolados (p\u00e1ginas web, repositorios, etc\u2026.) como es el mundo Google. No existen medios infalibles que puedan impedir que se produzca el fraude, y como dice Emilio Delgado L\u00f3pez-C\u00f3zar (2007) respecto al <i>peer-review <\/i>como sistema de evaluaci\u00f3n del fraude:<\/p>\n<p style=\"padding-left: 30px;\">no existen medios infalibles que puedan impedir que el fraude se produzca, ni la publicaci\u00f3n por si sola es un sello que garantice la fiabilidad y validez de una investigaci\u00f3n, ni el sistema de evaluaci\u00f3n por expertos es capaz de detectarlo y neutralizarlo. B\u00e1sicamente por dos razones. En primer lugar, porque el edificio cient\u00edfico se asienta sobre un pilar axiom\u00e1tico que es falseable: se basa en la buena voluntad de los cient\u00edficos; &#8230; pero si un cient\u00edfico quiere mentir mentir\u00e1. &#8230; En segundo lugar, porque el sistema de alerta que emplea la ciencia para contrastar la verosimilitud y veracidad de un descubrimiento se aplica en muy pocos casos&#8230;\u00a0 es impracticable dado el volumen actual que ha adquirido la ciencia.<\/p>\n<p>En el mundo de la inform\u00e1tica estamos acostumbrados a los virus, troyanos, <i>hackers<\/i>, <i>phishing<\/i>, <i>spamming<\/i>, etc., y para esto se instalan <i>firewalls<\/i>, antivirus, <i>blacklists<\/i>, contrase\u00f1as, y toda clase de sistemas de seguridad inform\u00e1tica. Quienes programan esos \u201cengendros inform\u00e1ticos\u201d y los usan son graduados de ciencias de la computaci\u00f3n, quienes muchas veces desarrollan estas actividades como parte de sus trabajos de estudio o tan solo como desaf\u00edos personales y hasta por diversi\u00f3n (<i>just for fun<\/i>).<\/p>\n<h3>Reflexiones<\/h3>\n<p>Una vez que los trabajos fraudulentos son detectados, las editoriales responsables seguramente remover\u00e1n esos art\u00edculos, pero deber\u00edan dejar nota explicando su ausencia. Cabe la pregunta entonces, qu\u00e9 pasa con las cuentas y los \u00edndices de <i>Google Scholar<\/i>, si se reajustan reduciendo los indicadores, y qu\u00e9 pasa con los trabajos y p\u00e1ginas que mantienen links a esos trabajos descartados, \u00bfsiguen siendo v\u00e1lidos?<\/p>\n<p>Los investigadores cient\u00edficos son como todos los seres humanos, y en un ambiente de alta competencia, donde hay mucho dinero y prestigio envueltos siempre habr\u00e1 personas dispuestas a \u201colvidarse\u201d de las reglas.<\/p>\n<p>Los sistemas editoriales deben incorporar los controles correspondientes en sus procedimientos de arbitraje. Como hemos comentado en posts anteriores sobre el plagio, los editores participantes en el Programa SciELO deber\u00edan incorporar tambi\u00e9n procedimientos profesionales para evitar esta clase de publicaciones fraudulentas.<\/p>\n<h3>Notas<\/h3>\n<p>\u00b9 NOORDEN, R. V. Publishers withdraw more than 120 gibberish papers. Conference proceedings removed from subscription databases after scientist reveals that they were computer-generated. <i>Nature<\/i>. [viewed 24 February 2014]. Available from: &lt;<a href=\"http:\/\/www.nature.com\/news\/publishers-withdraw-more-than-120-gibberish-papers-1.14763\" target=\"_blank\" rel=\"noopener noreferrer\">http:\/\/www.nature.com\/news\/publishers-withdraw-more-than-120-gibberish-papers-1.14763<\/a>&gt;.<\/p>\n<p>\u00b2 <i>How computer-generated fake papers are flooding academia<\/i>. The Guardian. [viewed 27 February 2014]. Available from: &lt;<a href=\"http:\/\/www.theguardian.com\/technology\/shortcuts\/2014\/feb\/26\/how-computer-generated-fake-papers-flooding-academia\" target=\"_blank\" rel=\"noopener noreferrer\">http:\/\/www.theguardian.com\/technology\/shortcuts\/2014\/feb\/26\/how-computer-generated-fake-papers-flooding-academia<\/a>&gt;.<\/p>\n<p>\u00b3 SCIgen &#8211; An Automatic CS Paper Generator &#8211; <a href=\"http:\/\/pdos.csail.mit.edu\/scigen\/\" target=\"_blank\" rel=\"noopener noreferrer\">http:\/\/pdos.csail.mit.edu\/scigen\/<\/a>.<\/p>\n<p>\u2074 LABB\u00c9, C., and LABB\u00c9, D. Duplicate and fake publications in the scientific literature: how many SCIgen papers in computer science. <i>Scientometrics<\/i>. [viewed 22 June 2012]. Available from: &lt;<a href=\"http:\/\/hal.archives-ouvertes.fr\/docs\/00\/71\/35\/55\/PDF\/0-FakeDetectionSci-Perso.pdf\" target=\"_blank\" rel=\"noopener noreferrer\">http:\/\/hal.archives-ouvertes.fr\/docs\/00\/71\/35\/55\/PDF\/0-FakeDetectionSci-Perso.pdf<\/a>&gt;.<\/p>\n<p>\u2075 AntiScigen &#8211; <a href=\"http:\/\/scigendetection.imag.fr\/main.php\" target=\"_blank\" rel=\"noopener noreferrer\">http:\/\/scigendetection.imag.fr\/main.php<\/a>.<\/p>\n<p><sup>6 <\/sup>An essay generator &#8211; <a href=\"http:\/\/www.essaygenerator.com\/\" target=\"_blank\" rel=\"noopener noreferrer\">http:\/\/www.essaygenerator.com\/<\/a>.<\/p>\n<p><sup>7<\/sup> SBIR grant proposal generator. <a href=\"http:\/\/www.nadovich.com\/chris\/randprop\/\" target=\"_blank\" rel=\"noopener noreferrer\">http:\/\/www.nadovich.com\/chris\/randprop\/<\/a>.<\/p>\n<h3>Referencias<\/h3>\n<p>COHEN, N. He Wrote 200,000 Books (but Computers Did Some of the Work). <i>The New Work Times. <\/i>[14 April 2008]. Available from: &lt;<a href=\"http:\/\/www.nytimes.com\/2008\/04\/14\/business\/media\/14link.html?pagewanted=all&amp;_r=0\" target=\"_blank\" rel=\"noopener noreferrer\">http:\/\/www.nytimes.com\/2008\/04\/14\/business\/media\/14link.html?pagewanted=all&amp;_r=0<\/a>&gt;.<\/p>\n<p>HILL, D.J. Patented book writing system creates, sells hundreds of thousands of books on amazon. <i>Singularity HUB. <\/i>[13 December 2012]. Available from: &lt;<a href=\"http:\/\/singularityhub.com\/2012\/12\/13\/patented-book-writing-system-lets-one-professor-create-hundreds-of-thousands-of-amazon-books-and-counting\/\" target=\"_blank\" rel=\"noopener noreferrer\">http:\/\/singularityhub.com\/2012\/12\/13\/patented-book-writing-system-lets-one-professor-create-hundreds-of-thousands-of-amazon-books-and-counting\/<\/a>&gt;.<\/p>\n<p>LABB\u00c9, C. Ike Antkare one of the greatest stars in the scientific firmament. <i>LIG Laboratory.<\/i> [14 April 2010]. Available from: &lt;<a href=\"http:\/\/hal.inria.fr\/docs\/00\/71\/35\/64\/PDF\/TechReportV2.pdf\" target=\"_blank\" rel=\"noopener noreferrer\">http:\/\/hal.inria.fr\/docs\/00\/71\/35\/64\/PDF\/TechReportV2.pdf<\/a>&gt;.<\/p>\n<p>L\u00d3PEZ-COZAR, E. D., SALINAS, D. T., and L\u00d3PEZ, A. R. El fraude en la ciencia: reflexiones a partir del caso Hwang. <i>El profesional de la informaci\u00f3n<\/i>. 2007, marzo-abril, vol. 16, n\u00ba 2. Available from: &lt;<a href=\"http:\/\/eprints.rclis.org\/9979\/1\/g61n63522lg20818.pdf\" target=\"_blank\" rel=\"noopener noreferrer\">http:\/\/eprints.rclis.org\/9979\/1\/g61n63522lg20818.pdf<\/a>&gt;.<\/p>\n<h3>Enlace externo<\/h3>\n<p>AntiScigen &#8211; <a href=\"http:\/\/scigendetection.imag.fr\/main.php\" target=\"_blank\" rel=\"noopener noreferrer\">http:\/\/scigendetection.imag.fr\/main.php<\/a><\/p>\n<p>&nbsp;<\/p>\n<h3><a href=\"http:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2013\/10\/spinak.jpg\" target=\"_blank\" rel=\"noopener noreferrer\"><img loading=\"lazy\" decoding=\"async\" class=\"alignright wp-image-537\" title=\"Ernesto Spinak\" src=\"http:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2013\/10\/spinak-300x271.jpg\" alt=\"Ernesto Spinak\" width=\"180\" height=\"163\" srcset=\"https:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2013\/10\/spinak-300x271.jpg 300w, https:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2013\/10\/spinak-768x694.jpg 768w, https:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2013\/10\/spinak-1024x926.jpg 1024w, https:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2013\/10\/spinak-150x136.jpg 150w\" sizes=\"auto, (max-width: 180px) 100vw, 180px\" \/><\/a>Sobre Ernesto Spinak<\/h3>\n<p>Colaborador do SciELO, Ingeniero en Sistemas y Lic. en Biblioteconom\u00eda, \u00a0con\u00a0 Diploma de Estudios Avanzados pela Universitat Oberta de Catalunya y Maestr\u00eda en &#8220;Sociedad de la Informaci\u00f3n&#8221; por la Universidad Oberta de Catalunya, Barcelona &#8211; Espa\u00f1a. \u00a0Actualmente tiene una empresa de consultor\u00eda que atiende a 14 instituciones de gobierno y universidades en Uruguay con proyectos de informaci\u00f3n.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Editoriales prestigiosas debieron retirar m\u00e1s de 120 art\u00edculos falsos fabricados por programas de computaci\u00f3n y lograron enga\u00f1ar a los procesos de arbitraje. Conozca c\u00f3mo es posible fraguar art\u00edculos en pocos minutos y tambi\u00e9n c\u00f3mo es posible detectarlos. La cuesti\u00f3n que surge es: por qu\u00e9 los sistemas de control editorial pueden ser enga\u00f1ados con tanta facilidad. <span class=\"ellipsis\">&hellip;<\/span> <span class=\"more-link-wrap\"><a href=\"https:\/\/blog.scielo.org\/es\/2014\/03\/31\/al-principio-eran-los-plagios-ahora-tambien-los-papers-automaticos-falsos\/\" class=\"more-link\"><span>Read More &rarr;<\/span><\/a><\/span><\/p>\n","protected":false},"author":8,"featured_media":848,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"om_disable_all_campaigns":false,"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"footnotes":"","_links_to":"","_links_to_target":""},"categories":[3],"tags":[7,37,10],"class_list":["post-846","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-analisis","tag-comunicacion-cientifica","tag-etica-en-la-comunicacion-cientifica","tag-factor-de-impacto"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/posts\/846","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/users\/8"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/comments?post=846"}],"version-history":[{"count":8,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/posts\/846\/revisions"}],"predecessor-version":[{"id":3242,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/posts\/846\/revisions\/3242"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/media\/848"}],"wp:attachment":[{"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/media?parent=846"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/categories?post=846"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/tags?post=846"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}