{"id":5475,"date":"2024-01-19T09:30:49","date_gmt":"2024-01-19T12:30:49","guid":{"rendered":"https:\/\/blog.scielo.org\/es\/?p=5475"},"modified":"2024-01-19T09:32:41","modified_gmt":"2024-01-19T12:32:41","slug":"publicacion-en-llm","status":"publish","type":"post","link":"https:\/\/blog.scielo.org\/es\/2024\/01\/19\/publicacion-en-llm\/","title":{"rendered":"Publicaci\u00f3n en Large Language Model (LLM) [Publicado originalmente en el blog Upstream en enero\/2024]"},"content":{"rendered":"<p><strong>Por Jeff Pooley<\/strong><\/p>\n<div id=\"attachment_5477\" style=\"width: 310px\" class=\"wp-caption alignright\"><a href=\"http:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2024\/01\/pexels-viktor-talashuk-2377295.jpg\" target=\"_blank\" rel=\"noopener\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-5477\" class=\"wp-image-5477 size-medium\" title=\"Fotograf\u00eda superpuesta de varios libros con las p\u00e1ginas dobladas en forma de avi\u00f3n sobre un fondo negro infinito.\" src=\"http:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2024\/01\/pexels-viktor-talashuk-2377295-300x199.jpg\" alt=\"Fotograf\u00eda superpuesta de varios libros con las p\u00e1ginas dobladas en forma de avi\u00f3n sobre un fondo negro infinito.\" width=\"300\" height=\"199\" srcset=\"https:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2024\/01\/pexels-viktor-talashuk-2377295-300x199.jpg 300w, https:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2024\/01\/pexels-viktor-talashuk-2377295-768x509.jpg 768w, https:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2024\/01\/pexels-viktor-talashuk-2377295.jpg 1000w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" \/><\/a><p id=\"caption-attachment-5477\" class=\"wp-caption-text\"><em>Imagen: <a href=\"https:\/\/www.pexels.com\/photo\/books-with-folded-pages-2377295\/\">Viktor Talashuk<\/a>.<\/em><\/p><\/div>\n<p>El <em>New York Times<\/em> dio la bienvenida al A\u00f1o Nuevo con una demanda contra <em>OpenAI<\/em> y <em>Microsoft<\/em>. El peri\u00f3dico cubri\u00f3 la demanda, apropiadamente, como una historia comercial importante. <em>OpenAI<\/em> y su patrocinador <em>Microsoft<\/em> hab\u00edan robado, seg\u00fan el expediente, \u201cmillones de art\u00edculos de noticias protegidos por derechos de autor del <em>Times<\/em>, investigaciones en profundidad, art\u00edculos de opini\u00f3n, rese\u00f1as, gu\u00edas pr\u00e1cticas\u201d y m\u00e1s, todo para entrenar los grandes modelos de lenguaje (<em>largue language models<\/em>, LLMs) de <em>OpenAI<\/em>. El <em>Times<\/em> present\u00f3 una demanda para detener el \u201caprovechamiento gratuito\u201d de las empresas de tecnolog\u00eda del \u201cperiodismo singularmente valioso\u201d del peri\u00f3dico.<\/p>\n<p><em>OpenAI<\/em> y <em>Microsoft<\/em>, por supuesto, han citado el uso leg\u00edtimo para justificar sus pr\u00e9stamos sin permiso. A lo largo de 70 p\u00e1ginas amargas, los abogados del <em>Times<\/em> examinaron con una excavadora los cuatro factores que los jueces estadounidenses consideran para el uso leg\u00edtimo. El informe tambi\u00e9n se\u00f1ala da\u00f1os a la reputaci\u00f3n, provenientes de respuestas inventadas que <em>ChatGPT<\/em> o Bing Chat atribuyen al <em>Times<\/em>: &#8220;En t\u00e9rminos sencillos, es desinformaci\u00f3n&#8221;.<\/p>\n<p>No hay duda de que los abogados de <em>Elsevier<\/em> y otros gigantes de las publicaciones acad\u00e9micas est\u00e1n leyendo atentamente el expediente del <em>Times<\/em>. Notar\u00e1n un leitmotiv: las costosas historias del peri\u00f3dico producen conocimiento confiable, que de otro modo escasea. En un \u201cecosistema de informaci\u00f3n da\u00f1ado [\u2026] inundado de contenido poco confiable\u201d, el periodismo del <em>Times<\/em> es un \u201cconjunto de datos excepcionalmente valioso\u201d para el entrenamiento de IA (inteligencia artificial), afirma el documento. Otras organizaciones de noticias tienen la misma opini\u00f3n; algunos han firmado acuerdos de licencia, mientras que otros est\u00e1n negociando con <em>OpenAI<\/em> y sus pares. No m\u00e1s viajes gratis.<\/p>\n<p>Es muy probable que las grandes editoriales acad\u00e9micas est\u00e9n de acuerdo. Y se encuentran en el otro corpus de conocimiento, ciencia y erudici\u00f3n examinados. Por lo tanto, es casi seguro que las conversaciones sobre la licencia est\u00e9n en marcha, y sin duda se est\u00e1n preparando amenazas y demandas. Al mismo tiempo, los editores comerciales est\u00e1n creando sus propios productos de IA. En el a\u00f1o transcurrido desde la llamativa entrada de <em>ChatGPT<\/em>, al menos tres de las cinco grandes editoriales acad\u00e9micas, adem\u00e1s de <em>Clarivate<\/em>, han anunciado herramientas y funciones impulsadas por LLM. A ellos se unen docenas de nuevas empresas respaldadas por capital de riesgo (objetivos de adquisici\u00f3n, todas y cada una) que prometen un impulso de la IA en todo el flujo de trabajo acad\u00e9mico, desde la b\u00fasqueda de literatura hasta la redacci\u00f3n de res\u00famenes y la edici\u00f3n de manuscritos.<\/p>\n<p>Por lo tanto, las dos principales fuentes de conocimiento confiable, la ciencia y el periodismo, est\u00e1n preparadas para extraer dinero por protecci\u00f3n, para de otro modo explotar sus vastas reservas de textos examinados como \u201cdatos de entrenamiento\u201d. Pero hay una diferencia clave entre las noticias y la ciencia: los salarios de los periodistas y el costo de informar los cubren las empresas. No ocurre lo mismo con las publicaciones acad\u00e9micas: los acad\u00e9micos, por supuesto, escriben y revisan de forma gratuita, y gran parte de nuestra investigaci\u00f3n est\u00e1 financiada por los contribuyentes. La demanda del <em>Times<\/em> est\u00e1 plagada de quejas sobre el costoso negocio del periodismo. Empresas como <em>Taylor &amp; Francis<\/em> y <em>Springer Nature<\/em> no tendr\u00e1n ese argumento que presentar. Es dif\u00edcil denunciar el parasitismo cuando se trata de su propio modelo de negocio.<\/p>\n<h3>Supervisi\u00f3n de Publicaci\u00f3n, Edici\u00f3n LLM<\/h3>\n<p>La exagerada espuma del ciclo publicitario de la IA ha llegado a las publicaciones acad\u00e9micas. La adopci\u00f3n febril, aunque en su mayor parte aspiracional, de la IA por parte de la industria debe leerse como la \u00faltima entrega de una campa\u00f1a en curso.<sup>1<\/sup> Liderados por <em>Elsevier<\/em>, los editores comerciales, durante aproximadamente una d\u00e9cada, han agregado otro negocio a sus operaciones editoriales heredadas. Ese negocio consiste en extraer y procesar los trabajos y el comportamiento de los acad\u00e9micos en productos de predicci\u00f3n, vendidos a universidades y agencias de investigaci\u00f3n. <em>Elsevier<\/em>, por ejemplo, vende un <em>software<\/em> para <em>tablet<\/em>, Pure, a las oficinas de evaluaci\u00f3n de las universidades, uno que asigna a cada uno de los investigadores de la escuela una huella digital (<em>Fingerprint\u00ae<\/em>) de palabras clave ponderadas. Los datos subyacentes provienen de <em>Scopus<\/em> de <em>Elsevier<\/em>, la base de datos de res\u00famenes y citas propiedad de la empresa. As\u00ed, el acad\u00e9mico es el producto: sus art\u00edculos y referencias alimentan a <em>Scopus<\/em> y Pure, que luego se venden a su empleador universitario. Esa misma universidad, por supuesto, ya desembolsa suscripciones usureras y d\u00f3lares en APC (<em>article processing charges<\/em>) a <em>Elsevier<\/em>, que, en una dolorosa iron\u00eda, han financiado la misma borrachera de adquisiciones que transform\u00f3 a la empresa en una editorial completa.<\/p>\n<p><em>Elsevier<\/em> y las otras grandes editoriales son, para tomar prestada la frase de Sarah Lamdan, c\u00e1rteles de datos. He llamado a este impulso para extraer ganancias de las publicaciones como vigilancia del comportamiento de los investigadores, por analog\u00eda con la noci\u00f3n de capitalismo de vigilancia de Shoshana Zuboff, en que las empresas como <em>Google<\/em> y <em>Meta<\/em> empaquetan datos de usuarios para venderlos a los anunciantes. La estrategia central empresarial es la misma para <em>Silicon Valley<\/em> y <em>Elsevier<\/em>: extraer datos del comportamiento para alimentar modelos predictivos que, a su vez, se refinan y se venden a los clientes. En un caso se trata de publicaciones en <em>Facebook<\/em> y en el otro de res\u00famenes y citas, pero en cualquier caso el punto es ganar dinero a partir de los subproductos del comportamiento (del consumidor o acad\u00e9mico). Una gran diferencia entre las grandes empresas tecnol\u00f3gicas y los editores es que Google y otros atraen a los usuarios con servicios gratuitos como <em>Gmail<\/em>: si no pagas por ellos, dice el refr\u00e1n, entonces t\u00fa eres el producto. En el caso de <em>Elsevier<\/em> somos el producto y pagamos (mucho) por \u00e9l.<\/p>\n<p><em>Elsevier<\/em> y algunas de las otras grandes editoriales ya aprovechan su gran cantidad de datos acad\u00e9micos para, por ejemplo, asignar palabras clave a acad\u00e9micos y obras. De hecho, llevan a\u00f1os utilizando la llamada IA, incluidas variaciones de las t\u00e9cnicas de aprendizaje autom\u00e1tico (ML), que han ido en aumento en los \u00faltimos 15 a\u00f1os aproximadamente. Lo que es diferente acerca de la inminente ganancia inesperada de licencias de los editores y la ola de herramientas anunciadas es, en una palabra, <em>ChatGPT<\/em>. Es cierto que versiones sucesivas de enormes modelos de \u201c<em>lenguaje grande<\/em>\u201d de <em>OpenAI<\/em>, <em>Google<\/em> y otros han estado dando vueltas en c\u00edrculos comerciales y acad\u00e9micos durante a\u00f1os. Pero el lanzamiento p\u00fablico de <em>ChatGPT<\/em> en noviembre de 2022 cambi\u00f3 las reglas del juego. Entre otras cosas, y casi de la noche a la ma\u00f1ana, el valor del contenido adquiri\u00f3 un color diferente. Cada uno de los gigantescos modelos \u201cfundacionales\u201d, incluida la serie GPT de <em>OpenAI<\/em>, se alimenta de prodigiosas porciones de texto. El apetito por dichos datos de capacitaci\u00f3n no est\u00e1 saciado, incluso cuando la legalidad de la ingesta en curso es una cuesti\u00f3n abierta y litigiosa.<\/p>\n<p>Las grandes editoriales creen que tienen una mina de oro. No se trata solo de su beca de texto completo tras los muros de pago, sino tambi\u00e9n de la gran cantidad de otros datos que obtienen de los acad\u00e9micos a trav\u00e9s de sus plataformas y productos. Al menos en teor\u00eda, su contenido propietario est\u00e1 (a diferencia del espect\u00e1culo de payasos de la <em>web<\/em> abierta) examinado y vinculado. Sobre esa base, los observadores han declarado que los editores pueden ser los \u201cmayores ganadores\u201d en la revoluci\u00f3n de la IA generativa. Tal vez. Pero de cualquier manera, espere que <em>Springer Nature<\/em>, <em>Taylor &amp; Francis<\/em>, <em>Elsevier<\/em>, <em>Wiley<\/em> y SAGE pongan a prueba la teor\u00eda.<\/p>\n<h3>Cotorras con Alucinaciones<\/h3>\n<p>Los modelos de lenguaje verdaderamente grandes, como los que impulsan <em>ChatGPT<\/em> y Bard, son notorios fabuladores. De manera rutinaria y segura, devuelven lo que el eufemismo de la industria llama &#8220;<em>alucinaciones<\/em>&#8220;. Algunos observadores esperan que el problema siga empeorando a medida que el material generado por LLM inunde Internet. Los grandes modelos, a causa de este miedo, se alimentar\u00e1n de su propia prosa plagada de falsedades en rondas de entrenamiento posteriores, una especie de canibalismo en lenguaje grande que, con el tiempo, podr\u00eda desplazar a cualquier porci\u00f3n de la red anterior al LLM que fuera m\u00e1s-o-menos -menos veraz.<\/p>\n<p>Una soluci\u00f3n al problema, con la acumulaci\u00f3n de capital de riesgo y el impulso del ciclo publicitario, es recurrir a los llamados \u201c<em>modelos de lenguaje<\/em> <em>peque\u00f1os<\/em>\u201d. La idea es aplicar las mismas t\u00e9cnicas de reconocimiento de patrones, pero en conjuntos de datos seleccionados y espec\u00edficos de un dominio. Una ventaja de los modelos m\u00e1s peque\u00f1os, seg\u00fan sus defensores, es su capacidad de restringir los datos de entrenamiento a lo conocido y verificable. La premisa es que, cuanto menos basura entre, menos basura saldr\u00e1.<\/p>\n<p>As\u00ed que no sorprende que el registro cient\u00edfico publicado haya surgido, en los rumores de la industria, como un eliminador de alucinaciones especialmente prometedor. Se piensa que aqu\u00ed hay un conjunto de conocimientos examinados, acordonados por fuera de la <em>Babelist<\/em> de Internet. Lo que hace que el corpus de investigaci\u00f3n sea diferente es, bueno, la revisi\u00f3n por pares y el control editorial, junto con las convenciones de citas y el supuesto compromiso de los acad\u00e9micos con una cultura de cr\u00edtica autocorregible. Por lo tanto, el registro publicado es, entre los cuerpos de texto explotables, excepcionalmente confiable. O eso es lo que afirman los evangelistas en <em>lenguaje peque\u00f1o<\/em>.<\/p>\n<p>Aqu\u00ed entra <em>Elsevier<\/em> y sus pares oligop\u00f3licos. Protegen (con vigilancia de pago) una gran parte de los estudios publicados, muchos de los cuales no se pueden descartar. Es cierto que una proporci\u00f3n cada vez mayor de su producci\u00f3n total es de acceso abierto, y una gran parte de ese material tiene una licencia no comercial. Los acuerdos est\u00e1ndar de acceso abierto tienden a otorgar a los editores derechos generales, por lo que tienen un derecho (aunque cuestionado por motivos de uso leg\u00edtimo por parte de <em>OpenAI<\/em> y similares) a la explotaci\u00f3n exclusiva. Incluso el resto de las obras de acceso abierto que permiten la reutilizaci\u00f3n comercial est\u00e1n encorraladas con el resto, en plataformas patentadas como <em>ScienceDirect<\/em> de <em>Elsevier<\/em>. Esas plataformas tambi\u00e9n rastrean el comportamiento de los investigadores, como descargas y citas, que pueden usarse para ajustar los resultados de sus modelos. En teor\u00eda, estos modelos podr\u00edan alimentarse de plataformas bibliogr\u00e1ficas patentadas, como <em>Web of Science<\/em> de <em>Clarivate<\/em>, <em>Scopus<\/em> de <em>Elsevier<\/em> y <em>Dimensions<\/em> de <em>Digital Science<\/em> (propiedad de la empresa matriz de <em>Springer Nature<\/em>).<\/p>\n<h3>\u201cLa Colecci\u00f3n m\u00e1s Grande del Mundo\u201d<\/h3>\n<p>Un \u00e1rea en la que ya est\u00e1n incursionando varios grandes editores es el resumen basado en b\u00fasquedas. <em>Elsevier<\/em> est\u00e1 probando <a href=\"https:\/\/beta.elsevier.com\/products\/scopus\/scopus-ai\" target=\"_blank\" rel=\"noopener\"><em>Scopus AI<\/em><\/a> y se espera un lanzamiento a principios de 2024. Los investigadores escriben preguntas en lenguaje natural y obtienen un resumen, con algunas preguntas de seguimiento y referencias sugeridas, que abren una vista de ScienceDirect en la barra lateral. Los resultados de <em>Scopus AI<\/em> tambi\u00e9n incluyen un \u201cMapa conceptual\u201d, un \u00e1rbol expandible basado en temas, presumiblemente impulsado por las palabras clave de las <em>huellas de identificaci\u00f3n<\/em> de la empresa.<\/p>\n<p>La herramienta est\u00e1 combinando sus t\u00edtulos y res\u00famenes de <em>Scopus<\/em> (a partir de 2018) y luego introduce los 10 resultados principales en un modelo <em>OpenAI<\/em> GPT para resumirlos. <em>Elsevier<\/em> no es t\u00edmida de su ventaja en t\u00e9rminos de tesoro de datos: <em>Scopus AI<\/em> est\u00e1 \u201cbasado en la colecci\u00f3n m\u00e1s grande del mundo de literatura acad\u00e9mica confiable y revisada por pares\u201d, proclama un llamativo video promocional.<\/p>\n<p><em>Springer Nature<\/em> y <em>Clarivate<\/em> tambi\u00e9n participan en la competencia de los res\u00famenes de b\u00fasqueda. <em>Dimensions<\/em>, el competidor de <em>Scopus<\/em> del hermano corporativo de <em>Springer Nature<\/em>, tiene un <a href=\"https:\/\/www.dimensions.ai\/discover-dimensions-ai-assistant\/\" target=\"_blank\" rel=\"noopener\">asistente de IA de <em>Dimensions<\/em><\/a> en prueba. Al igual que <em>Scopus AI<\/em>, la herramienta <em>Dimensions<\/em> recupera una peque\u00f1a cantidad de res\u00famenes basados en b\u00fasquedas conversacionales, recurriendo a modelos de <em>OpenAI<\/em> y Google para los res\u00famenes.<\/p>\n<p>Mientras tanto, <em>Clarivate<\/em>, propietaria de <em>Web of Science<\/em> y <em>ProQuest<\/em>, ha llegado a un acuerdo con <a href=\"https:\/\/www.ai21.com\/\" target=\"_blank\" rel=\"noopener\"><em>AI21 Labs<\/em><\/a>, una <em>startup<\/em> israel\u00ed de LLM (lema: \u201c<em>Cuando las M\u00e1quinas se Convierten en Socios de Pensamiento<\/em>\u201d). Utilizando el \u201ccontenido confiable de <em>Clarivate<\/em> como base\u201d, AI21 promete utilizar sus modelos para generar \u201crespuestas y servicios de alta calidad basados en el contexto\u201d, con lo que francamente llama \u201clos tesoros de contenido y datos de <em>Clarivate<\/em>\u201d.<\/p>\n<p>Las grandes empresas competir\u00e1n con un grupo de nuevas empresas respaldadas por capital de riesgo, incluidas <a href=\"https:\/\/ought.org\/elicit\" target=\"_blank\" rel=\"noopener\"><em>Ought<\/em><\/a> (\u201cAmpliar el buen razonamiento\u201d), <a href=\"https:\/\/iris.ai\/\" target=\"_blank\" rel=\"noopener\"><em>iris.ai<\/em><\/a> (\u201c<em>The Researcher Workspace<\/em>\u201d), <a href=\"https:\/\/scisummary.com\/\" target=\"_blank\" rel=\"noopener\"><em>SciSummary<\/em><\/a> (\u201cUtilice IA para resumir art\u00edculos cient\u00edficos en segundos\u201d) , <a href=\"https:\/\/www.petal.org\/\" target=\"_blank\" rel=\"noopener\"><em>Petal<\/em><\/a> (\u201cChatea con tus documentos\u201d), <a href=\"https:\/\/jenni.ai\/\" target=\"_blank\" rel=\"noopener\"><em>Jenni<\/em><\/a> (\u201cMejora tu pr\u00f3ximo trabajo de investigaci\u00f3n\u201d), <a href=\"https:\/\/www.scholarcy.com\/\" target=\"_blank\" rel=\"noopener\"><em>scholarcy<\/em><\/a> (\u201cEl resumidor de art\u00edculos impulsado por IA\u201d), <a href=\"https:\/\/imagetwin.ai\/\" target=\"_blank\" rel=\"noopener\"><em>Imagetwin<\/em><\/a> (\u201cAumenta la calidad en la ciencia\u201d), <a href=\"https:\/\/keenious.com\/\" target=\"_blank\" rel=\"noopener\"><em>keenious<\/em><\/a> (\u201cEncuentra investigaciones relevante para cualquier documento!\u201d), y <a href=\"https:\/\/consensus.app\/home\/about-us\/\" target=\"_blank\" rel=\"noopener\"><em>Consensus<\/em><\/a> (\u201cMotor de b\u00fasqueda de IA para investigaci\u00f3n\u201d.<\/p>\n<p>Una pregunta abierta es si las <em>startups<\/em> pueden competir con las grandes editoriales; muchos utilizan la base de datos de acceso abierto <a href=\"https:\/\/www.semanticscholar.org\/\" target=\"_blank\" rel=\"noopener\"><em>Semantic Scholar<\/em><\/a>, que excluye el texto completo de los art\u00edculos de pago. Han obtenido mucho respaldo de capital de riesgo, pero, si la industria de la IA en general sirve de gu\u00eda, las nuevas empresas enfrentar\u00e1n un camino cuesta arriba para mantenerse independientes. Despu\u00e9s de todo, la IA comercial est\u00e1 dominada por un pu\u00f1ado de corporaciones gigantes estadounidenses y chinas, casi todas grandes empresas tecnol\u00f3gicas. La industria tiene feroces econom\u00edas de escala, en gran parte porque la construcci\u00f3n de modelos requiere enormes recursos financieros y humanos.<\/p>\n<p>Es muy posible que las grandes editoriales se encuentren en una posici\u00f3n privilegiada similar. Los dep\u00f3sitos de art\u00edculos de texto completo y otros datos de propiedad privada de las empresas son una ventaja incorporada. Sus m\u00e1rgenes astron\u00f3micos en los negocios tradicionales de suscripci\u00f3n y publicaci\u00f3n con APC significan que tienen el capital disponible para invertir y adquirir. La racha de adquisiciones de <em>Elsevier<\/em> que dur\u00f3 una d\u00e9cada fue, de la misma manera, financiada por sus lucrativas ganancias. Hay muchas razones para esperar que la empresa financie sus costosas inversiones en LLM con el mismo super\u00e1vit. Es probable que los pares de <em>Elsevier<\/em> sigan su ejemplo. Por lo tanto, las universidades y los contribuyentes est\u00e1n sirviendo, de hecho, como un fondo de capital para productos de IA que, a su vez, nos ser\u00e1n vendidos. Es posible que las nuevas empresas independientes se adquieran en el camino. Los propios editores gigantes pueden ser objetivos de adquisici\u00f3n para las empresas a\u00fan m\u00e1s grandes de Silicon Valley, \u00e1vidas de datos de capacitaci\u00f3n, como <a href=\"https:\/\/scholarlykitchen.sspnet.org\/2023\/08\/08\/will-building-llms-become-the-new-revenue-driver-for-academic-publishing\/\" target=\"_blank\" rel=\"noopener\">observ\u00f3 recientemente Avi Staiman en <em>The Scholarly Kitchen<\/em><\/a>.<sup>2<\/sup><\/p>\n<p>La borrachera de adquisiciones ya ha comenzado. En octubre, <em>Springer Nature<\/em> <a href=\"https:\/\/group.springernature.com\/gp\/group\/media\/press-releases\/acquisition-slimmer-ai-science-division\/26215608\" target=\"_blank\" rel=\"noopener\">adquiri\u00f3<\/a> la divisi\u00f3n cient\u00edfica de <a href=\"https:\/\/www.slimmer.ai\/\" target=\"_blank\" rel=\"noopener\"><em>Slimmer AI<\/em><\/a>, un \u201cestudio de riesgo de IA\u201d holand\u00e9s con el que el editor ha trabajado desde 2015 en herramientas de revisi\u00f3n por pares y detecci\u00f3n de plagio. Mientras tanto, <em>Digital Science<\/em> acaba de comprar <a href=\"https:\/\/www.researchinformation.info\/news\/digital-science-acquires-ai-service-writefull?utm_campaign=RI%20Newsline%2028-11-23&amp;utm_content=https%3A%2F%2Fwww.researchinformation.info%2Fnews%2Fdigital-science-acquires-ai-service-writefull&amp;utm_term=Research%20Information&amp;utm_medium=email&amp;utm_source=Adestra\" target=\"_blank\" rel=\"noopener\"><em>Writefull<\/em><\/a>, que trabaja como asistente de redacci\u00f3n acad\u00e9mica (para unirse a <a href=\"https:\/\/www.aje.com\/curie\/\" target=\"_blank\" rel=\"noopener\"><em>Curie<\/em><\/a>, recientemente anunciada por su hermana corporativa <em>Springer Nature<\/em>). <em>Digital Science<\/em> present\u00f3 la adquisici\u00f3n como un modelo de lenguaje reducido: &#8220;Si bien el enfoque m\u00e1s amplio se centra actualmente en los LLM&#8221;, dijo un ejecutivo de la compa\u00f1\u00eda en el <a href=\"https:\/\/www.researchinformation.info\/news\/digital-science-acquires-ai-service-writefull?utm_campaign=RI%20Newsline%2028-11-23&amp;utm_content=https%3A%2F%2Fwww.researchinformation.info%2Fnews%2Fdigital-science-acquires-ai-service-writefull&amp;utm_term=Research%20Information&amp;utm_medium=email&amp;utm_source=Adestra\" target=\"_blank\" rel=\"noopener\">comunicado de prensa<\/a>,<sup>3<\/sup> &#8220;los modelos peque\u00f1os y especializados de <em>Writefull<\/em> ofrecen m\u00e1s flexibilidad, a menor costo, con m\u00e9tricas auditables&#8221;. <em>Research Solutions<\/em>, una empresa de Nevada que vende acceso a contenidos de pago de las grandes editoriales comerciales a corporaciones, compr\u00f3 recientemente <a href=\"https:\/\/scite.ai\/\" target=\"_blank\" rel=\"noopener\"><em>scite<\/em><\/a>, una <em>startup<\/em> cuya novedosa oferta (contextos de citas) ha sido reenvasada como \u201c<em>ChatGPT<\/em> para la ciencia\u201d.<\/p>\n<h3>\u00bfUso justo?<\/h3>\n<p>Como sugiere la demanda del <em>Times<\/em>, hay un gran signo de interrogaci\u00f3n legal sobre las perspectivas de IA de las grandes editoriales. La cuesti\u00f3n clave, que se abre paso en los tribunales, es el uso leg\u00edtimo: \u00bfpueden empresas como <em>OpenAI<\/em> incorporar contenido protegido por derechos de autor a sus modelos, sin permiso ni compensaci\u00f3n? Las empresas tecnol\u00f3gicas de <em>Silicon Valley<\/em> as\u00ed lo creen; son nuevos conversos al maximalismo del uso leg\u00edtimo, como lo revelan sus comentarios p\u00fablicos presentados ante la Oficina de Derechos de Autor de EE.UU. El &#8220;mensaje general&#8221; de las empresas, <a href=\"https:\/\/www.theverge.com\/2023\/11\/4\/23946353\/generative-ai-copyright-training-data-openai-microsoft-google-meta-stabilityai\" target=\"_blank\" rel=\"noopener\">inform\u00f3 <em>The Verge<\/em> en un resumen<\/a>,<sup>4<\/sup> es que &#8220;no creen que deban pagar para entrenar modelos de IA en trabajos protegidos por derechos de autor&#8221;. Los artistas y otros creadores de contenido han discrepado y han presentado un pu\u00f1ado de demandas de alto perfil.<\/p>\n<p>Los editores a\u00fan no han presentado sus propias demandas, pero ciertamente est\u00e1n observando los casos con atenci\u00f3n. <em>Wiley<\/em>, por su parte, <a href=\"https:\/\/www.nature.com\/articles\/d41586-023-03144-w\" target=\"_blank\" rel=\"noopener\"><em>dijo a Nature<\/em><\/a><sup>5<\/sup> que estaba \u201csiguiendo de cerca los informes y litigios de la industria que afirmaban que los modelos generativos de IA est\u00e1n recolectando material protegido con fines de capacitaci\u00f3n, sin tener en cuenta las restricciones existentes sobre esa informaci\u00f3n\u201d. La firma ha pedido auditor\u00edas y supervisi\u00f3n regulatoria de los modelos de IA para abordar el &#8220;potencial de uso no autorizado de contenido restringido como insumo para el entrenamiento de modelos&#8221;. <em>Elsevier<\/em>, por su parte, ha prohibido el uso de &#8220;nuestro contenido y datos&#8221; para capacitaci\u00f3n; Asimismo, su empresa hermana <em>LexisNexis<\/em> envi\u00f3 <a href=\"https:\/\/www.optica-opn.org\/home\/articles\/volume_34\/october_2023\/features\/generative_ai_meets_scientific_publishing\/\" target=\"_blank\" rel=\"noopener\">recientemente un correo electr\u00f3nico a sus clientes<\/a><sup>6<\/sup> para \u201crecordarles\u201d que est\u00e1 prohibido enviar contenido a \u201cgrandes modelos ling\u00fc\u00edsticos e IA generativa\u201d. CCC (nacida como <em>Copyright Clearance Center<\/em>), en <a href=\"https:\/\/scholarlykitchen.sspnet.org\/2023\/11\/28\/the-united-states-copyright-office-notice-of-inquiring-on-ai-a-quick-take\/\" target=\"_blank\" rel=\"noopener\">sus propios comentarios a la Oficina de Derechos de Autor de EE.UU<\/a>.,7 adopt\u00f3 una postura predeciblemente contundente sobre la cuesti\u00f3n.<\/p>\n<p style=\"padding-left: 40px;\">Ciertamente, hay suficiente material protegido por derechos de autor disponible bajo licencia para construir una IA confiable, viable y digna de confianza. El hecho de que un desarrollador quiera utilizar \u201ctodo\u201d no significa que deba hacerlo, que est\u00e9 habilitado a hacerlo o que tenga derecho a hacerlo. Los gobiernos y los tribunales tampoco deber\u00edan torcer o modificar la ley para acomodarlos.<sup>7<\/sup><\/p>\n<p><em>\u00a0<\/em>La CCC, una organizaci\u00f3n con fines de lucro, es el principal organismo encargado de otorgar licencias y permisos a la industria editorial. Las grandes empresas tecnol\u00f3gicas y los gigantes de las publicaciones comerciales ya est\u00e1n maniobrando para posicionarse. Como se\u00f1al\u00f3 Joseph Esposito [en una <a href=\"https:\/\/scholarlykitchen.sspnet.org\/2023\/07\/12\/who-is-going-to-make-money-from-artificial-intelligence-in-scholarly-communications\/\" target=\"_blank\" rel=\"noopener\">publicaci\u00f3n reciente de <em>Scholarly Kitchen<\/em><\/a>],<sup>8<\/sup> un agudo observador de las publicaciones acad\u00e9micas: \u201clos editores cient\u00edficos en particular pueden tener un papel especial y remunerativo que desempe\u00f1ar aqu\u00ed\u201d.<\/p>\n<p>Una consecuencia a corto plazo puede ser un cambio en el enfoque de las grandes editoriales respecto del acceso abierto. Las empresas ya est\u00e1n actualizando sus licencias y t\u00e9rminos para prohibir la capacitaci\u00f3n comercial en IA (para cualquiera que no sean ellos, por supuesto). Las empresas tambi\u00e9n podr\u00edan retirarse por completo del <em>Open Access<\/em>, para conservar una mayor proporci\u00f3n de contenido exclusivo para extraer. Esposito hizo expl\u00edcito el argumento en la publicaci\u00f3n reciente de <em>Scholarly Kitchen<\/em>: &#8220;El hecho desafortunado del asunto es que el movimiento OA y las personas y organizaciones que lo apoyan han sido cooptados por el mundo tecnol\u00f3gico mientras construyen IA entrenada en contenido&#8221;.<sup>8<\/sup> Los editores necesitan \u201cm\u00e1s protecci\u00f3n de los derechos de autor, no menos\u201d, a\u00f1adi\u00f3. La firma consultora de Esposito, en su \u00faltimo <a href=\"https:\/\/www.ce-strategy.com\/the-brief\/gemini\/\" target=\"_blank\" rel=\"noopener\">bolet\u00edn<\/a>,<sup>9<\/sup> calific\u00f3 la licencia liberal <a href=\"https:\/\/creativecommons.org\/licenses\/by\/4.0\/\" target=\"_blank\" rel=\"noopener\"><em>Creative Commons BY<\/em><\/a> como un \u201cmecanismo para transferir valor de los editores cient\u00edficos y acad\u00e9micos a las empresas tecnol\u00f3gicas m\u00e1s ricas del mundo\u201d. Quiz\u00e1s, aunque quisiera comenzar con este punto: <em>la publicaci\u00f3n acad\u00e9mica comercial<\/em> es un mecanismo para transferir valor de los acad\u00e9micos, los contribuyentes y las universidades a las empresas m\u00e1s rentables del mundo.<\/p>\n<h3>El efecto Mateo en la IA<\/h3>\n<p>Hay ciento una razones para preocuparse de que <em>Elsevier<\/em> explote nuestra beca para maximizar sus ganancias. Quiero detenerme en lo que podr\u00eda decirse que es lo m\u00e1s importante: los efectos potenciales sobre el conocimiento mismo. En el centro de estas herramientas, incluida una avalancha predecible de productos a\u00fan no anunciados, hay una serie de verbos: sacar a la luz, clasificar, resumir y recomendar. El objeto de cada verbo somos nosotros: nuestra erudici\u00f3n y nuestro comportamiento. Lo que est\u00e1 en juego es el tipo de conocimiento que emergen de los modelos y de qui\u00e9n es el conocimiento.<\/p>\n<p>Los modelos de IA est\u00e1n preparados para servir como \u00e1rbitros del conocimiento, seleccionando ganadores y perdedores seg\u00fan lo que hacen visible. Hay dos grandes problemas entrelazados con este rol: los modelos est\u00e1n entrenados en el pasado y su l\u00f3gica de filtrado es inescrutable. Como resultado, pueden introducir de contrabando los numerosos sesgos que marcan la historia de la erudici\u00f3n en torno al g\u00e9nero, la geograf\u00eda y otras l\u00edneas de diferencia. En este contexto, resulta \u00fatil revivir un viejo concepto de la sociolog\u00eda de la ciencia. Seg\u00fan el efecto Mateo, nombrado por Robert Merton hace d\u00e9cadas, los acad\u00e9micos destacados y bien citados tienden a recibir a\u00fan m\u00e1s prominencia y citas. La otra cara de la moneda es que los acad\u00e9micos menos citados tienden a caer en una mayor oscuridad con el tiempo. (\u201cPorque al que tiene se le dar\u00e1 m\u00e1s, y tendr\u00e1 en abundancia; pero al que no tiene, hasta lo que tiene le ser\u00e1 quitado\u201d\u2014\u200aMateo 25:29.) Estas din\u00e1micas que la ventaja acumulativa tiene, en la pr\u00e1ctica, sirvieron para amplificar las desigualdades sistem\u00e1ticas del sistema de conocimiento (por ejemplo, en el caso del g\u00e9nero y la erudici\u00f3n del siglo XX, acertadamente denominado Efecto Matilda por Margaret Rossiter).<\/p>\n<p>El despliegue de modelos de IA en la ciencia, especialmente los patentados, puede producir un efecto Mateo en la escala de <em>Scopus<\/em>, y sin rastro documental. El problema es an\u00e1logo al bien documentado <em>contrabando de sesgos<\/em> con los modelos generativos existentes; las herramientas de imagen entrenadas, por ejemplo, con fotograf\u00edas en su mayor\u00eda blancas y masculinas, reproducen la distorsi\u00f3n en los resultados generados mediante indicaciones. Con nuestra erudici\u00f3n cargada de sesgos como datos de capacitaci\u00f3n, los modelos acad\u00e9micos pueden arrojar resultados que, de hecho, repliquen la desigualdad. Lo peor es que no lo sabremos realmente, debido al car\u00e1cter de caja negra de los modelos. Por lo tanto, las herramientas pueden actuar como m\u00e1quinas de lavado: abstracciones que borran el contexto y disfrazan su \u201crazonamiento\u201d probabil\u00edstico. Los sesgos existentes, como la propensi\u00f3n de los acad\u00e9micos varones a autocitarse, pueden ganar una nueva capa de legitimidad algor\u00edtmica. O consideremos la din\u00e1mica centro-periferia a lo largo de l\u00edneas Norte-Sur y de habla inglesa nativa: las brechas que se pueden rastrear hasta la historia geopol\u00edtica, incluido el legado del colonialismo europeo, pueden estar enterradas a\u00fan m\u00e1s profundamente. En resumen, los modelos podr\u00edan servir como multiplicadores de privilegios.<\/p>\n<p>Los modelos de IA no van a desaparecer, pero deber\u00edamos exigir que, en la medida de lo posible, las herramientas y los modelos est\u00e9n sujetos a escrutinio y estudio. Esto significa descartar productos propietarios, a menos que puedan abrirse mediante ley o regulaci\u00f3n. Mientras tanto, deber\u00edamos incorporar los modelos internamente, dentro del \u00e1mbito acad\u00e9mico, utilizando colecciones alineadas con la misi\u00f3n como <a href=\"https:\/\/core.ac.uk\/about\" target=\"_blank\" rel=\"noopener\">CORE<\/a> de la <em>Open University<\/em> y <a href=\"https:\/\/www.semanticscholar.org\/\" target=\"_blank\" rel=\"noopener\"><em>Semantic Scholar<\/em><\/a> del Instituto Allen. Los esfuerzos liderados por la academia para construir modelos y herramientas sin fines de lucro deben ser transparentes, explicables y auditables.<\/p>\n<h3>Dejar de hacer el seguimento a la beca<\/h3>\n<p>Estos son los primeros d\u00edas. La inseguridad jur\u00eddica, la burbuja virtual, la prosa sin aliento del informe anual: todo apunta a la aspiraci\u00f3n y la prospecci\u00f3n de la alta direcci\u00f3n. Todav\u00eda no vivimos en un mundo de modelos editoriales de lenguaje reducido, entrenados en nuestro trabajo y comportamiento.<\/p>\n<p>A\u00fan as\u00ed, estoy convencido de que los cinco grandes editores, adem\u00e1s de <em>Clarivate<\/em>, har\u00e1n todo lo posible para aumentar sus m\u00e1rgenes con nuevos ingresos de la IA. Supongo que desarrollar\u00e1n y seguir\u00e1n en su camino hacia una cartera de productos a lo largo y ancho del ciclo de vida de la investigaci\u00f3n, seg\u00fan el modelo completo existente de <em>Elsevier<\/em>. Despu\u00e9s de todo, y dependiendo de lo que entendemos por IA, los editores comerciales llevan a\u00f1os lanzando productos de IA. Cada se\u00f1al sugiere que acelerar\u00e1n el ritmo, con una b\u00fasqueda exagerada de modelos de lenguaje estilo GPT en particular. Nos vender\u00e1n sus propios productos y, predigo, otorgar\u00e1n licencias de nuestros art\u00edculos a los grandes modelos de financiadores, por voluntad judicial.<\/p>\n<p>Por lo tanto, es una tarea urgente retroceder ahora y no esperar hasta que los modelos est\u00e9n entrenados y desplegados. Lo que se necesita es una campa\u00f1a en toda regla, que aproveche el activismo y la presi\u00f3n legislativa, para desafiar la agenda extractiva de los editores comerciales. Un paso crucial en el marco es tratar la inminente avalancha de IA como una continuaci\u00f3n (como una extensi\u00f3n) de la mutaci\u00f3n en curso de los editores hacia negocios de datos de vigilancia capitalista. La era de la vigilancia de editores comenz\u00f3 simb\u00f3licamente en 2015, cuando Reed-<em>Elsevier<\/em> adopt\u00f3 su \u201cnombre m\u00e1s corto y moderno\u201d <em>RELX Group<\/em> para marcar su \u201ctransformaci\u00f3n\u201d de editor a \u201cnegocio impulsado por tecnolog\u00eda, contenido y an\u00e1lisis\u201d. Han cumplido su promesa, rozando la crema conductual de los acad\u00e9micos con avidez producto por producto. Los pares de <em>Clarivate<\/em> y <em>Elsevier<\/em> han seguido su ejemplo.<\/p>\n<p>Por lo tanto, el giro hacia la IA es m\u00e1s de lo mismo, s\u00f3lo que m\u00e1s. El c\u00f3ctel de probabilidad, predicci\u00f3n y beneficio de los editores se basa en el mismo proceso: extraer nuestra erudici\u00f3n y comportamiento, y luego revendernoslo en forma congelada. Hay m\u00e1s en juego dado que algunas de las editoriales est\u00e1n integradas en conglomerados de an\u00e1lisis de datos: RELX (<em>Elsevier<\/em>) e Informa (<em>Taylor &amp; Francis<\/em>), a los que se unen empresas adyacentes a las editoriales como <em>Clarivate<\/em> y <em>Thomson Reuters<\/em>. \u00bfEst\u00e1n las empresas polinizando sus negocios acad\u00e9micos y de \u201csoluciones de riesgo\u201d? <em>LexisNexis<\/em> de RELX vendi\u00f3 herramientas de seguimiento facial y otras herramientas de vigilancia a la Oficina de Aduanas y Protecci\u00f3n Fronteriza de EE.UU. el a\u00f1o pasado, como <a href=\"https:\/\/theintercept.com\/2023\/11\/16\/lexisnexis-cbp-surveillance-border\" target=\"_blank\" rel=\"noopener\">inform\u00f3 recientemente <em>The Intercept<\/em><\/a>.<sup>10<\/sup> Como lo expres\u00f3 SPARC (la alianza de bibliotecas) en su <a href=\"https:\/\/zenodo.org\/doi\/10.5281\/zenodo.10078609\" target=\"_blank\" rel=\"noopener\">informe de noviembre en la plataforma <em>ScienceDirect<\/em> de <em>Elsevie<\/em><em>r<\/em><\/a>: \u201cHay poco o nada que impida que los proveedores que recopilan y rastrean los datos de los usuarios [de la biblioteca] proporcionen esos datos, ya sea en su forma cruda o en conjunto. en su negocio de intermediaci\u00f3n de datos\u201d.<sup>11<\/sup><\/p>\n<p>Hasta ahora, la acumulaci\u00f3n de datos por parte de los editores no ha impulsado a los acad\u00e9micos a protestar. La raz\u00f3n principal es que la mayor\u00eda de los acad\u00e9micos ignoran alegremente el seguimiento, lo cual no sorprende, dada la ignorancia de los acad\u00e9micos, demasiado ocupada como para preocuparse, sobre el sistema de publicaci\u00f3n en s\u00ed. La comunidad bibliotecaria est\u00e1 mucho m\u00e1s en sinton\u00eda con el saqueo no consentido, aunque los bibliotecarios (aparte de SPARC) no se han organizado sobre el tema. Ha habido notas dispersas de disensi\u00f3n, incluida una petici\u00f3n <a href=\"https:\/\/stoptrackingscience.eu\/\" target=\"_blank\" rel=\"noopener\"><em>Stop Tracking Science<\/em><\/a> para detener el seguimiento de la ciencia y una protesta de acad\u00e9micos holandeses por un acuerdo de datos y publicaci\u00f3n de 2020 con <em>Elsevier<\/em>, en gran parte porque la compa\u00f1\u00eda hab\u00eda incluido sus productos de predicci\u00f3n en el acuerdo. En 2022, la fundaci\u00f3n nacional de investigaci\u00f3n alemana, <em>Deutsche Forschungsgemeinschaft<\/em> (DFG), public\u00f3 su propio <a href=\"https:\/\/www.dfg.de\/resource\/blob\/174924\/d99b797724796bc1a137fe3d6858f326\/datentracking-papier-en-data.pdf\" target=\"_blank\" rel=\"noopener\">informe-advertencia<\/a>: \u201cindustrializaci\u00f3n del conocimiento mediante el seguimiento\u201d,<sup>12<\/sup> en palabras del informe. A intervalos regulares han aparecido duras cr\u00edticas de, entre otros Bjorn Brembs, Leslie Chan, Renke Siems, Lai Ma, y Sarah Lamdan.<\/p>\n<p>Nada de esto se ha traducido en mucho, ni siquiera en conciencia entre el p\u00fablico acad\u00e9mico en general. Una campa\u00f1a coordinada de promoci\u00f3n y concientizaci\u00f3n debe ir acompa\u00f1ada de estudios profundos y de alta calidad sobre la recopilaci\u00f3n de datos de los editores, como el ejemplo del reciente <a href=\"https:\/\/sparcopen.org\/news\/2023\/sparc-report-urges-action-to-address-concerns-with-sciencedirect-data-privacy-practices\/\" target=\"_blank\" rel=\"noopener\">informe<em> ScienceDirect<\/em> de SPARC<\/a>.<sup>13<\/sup> Cualquier esfuerzo como \u00e9ste deber\u00eda basarse en la premisa de que otro mundo de publicaciones acad\u00e9micas es posible. Nuestro actual acuerdo de custodia compartida (editores con fines de lucro y universidades sin fines de lucro) es un desarrollo reciente y reversible. Hay muchas buenas razones para devolver la custodia a la academia. La \u00faltima es evitar que nuestro trabajo impulse las ganancias de la IA de los editores.<\/p>\n<h3>Notas<\/h3>\n<p>1. El t\u00e9rmino en s\u00ed es enga\u00f1oso, aunque ahora inevitable. Por IA (inteligencia artificial), me refiero principalmente al conjunto de t\u00e9cnicas que ahora se agrupan habitualmente bajo la etiqueta de \u201caprendizaje autom\u00e1tico\u201d. Hay una iron\u00eda en esta captura ling\u00fc\u00edstica. Durante d\u00e9cadas despu\u00e9s de su acu\u00f1aci\u00f3n a mediados de la d\u00e9cada de 1950, la \u201cinteligencia artificial\u201d se utiliz\u00f3 para designar un enfoque rival, basado en reglas y s\u00edmbolos. Lo que hoy casi todo el mundo llama IA estaba, hasta hace unos 30 a\u00f1os, excluido del club. La historia de c\u00f3mo las redes neuronales y otras t\u00e9cnicas de aprendizajbe autom\u00e1tico lograron la aceptaci\u00f3n a\u00fan no ha encontrado su cronista. Lo que est\u00e1 claro es que una fuerte ca\u00edda de la financiaci\u00f3n en la d\u00e9cada de 1980 (el llamado \u201cinvierno de la IA\u201d) convirti\u00f3 al otrora excluido rival del aprendizaje autom\u00e1tico (sus \u00e9xitos predictivos se exhibieron durante las d\u00e9cadas siguientes) en una ayuda muy atractiva para recuperar el poder y conceder dinero. Este ensayo se basa en una charla invitada pronunciada para la <a href=\"https:\/\/jfinnell.colgate.domains\/horizons\/\" target=\"_blank\" rel=\"noopener\">serie de coloquios <em>Horizons<\/em><\/a> de la Universidad de Colgate en octubre de 2023.<\/p>\n<p>2. STAIMAN, A. Will Building LLMs Become the New Revenue Driver for Academic Publishing? [online]. <em>The Scholarly Kitchen<\/em>, 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/scholarlykitchen.sspnet.org\/2023\/08\/08\/will-building-llms-become-the-new-revenue-driver-for-academic-publishing\/\" target=\"_blank\" rel=\"noopener\">https:\/\/scholarlykitchen.sspnet.org\/2023\/08\/08\/will-building-llms-become-the-new-revenue-driver-for-academic-publishing\/<\/a><\/p>\n<p>3. Digital Science acquires AI service Writefull [online]. Research Information. 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/www.researchinformation.info\/news\/digital-science-acquires-ai-service-writefull\" target=\"_blank\" rel=\"noopener\">https:\/\/www.researchinformation.info\/news\/digital-science-acquires-ai-service-writefull<\/a><\/p>\n<p>4. DAVIS, W. AI companies have all kinds of arguments against paying for copyrighted content [online]. 2023 [viewed 19 January 2024]. The Verge. Available from: <a href=\"https:\/\/www.theverge.com\/2023\/11\/4\/23946353\/generative-ai-copyright-training-data-openai-microsoft-google-meta-stabilityai\" target=\"_blank\" rel=\"noopener\">https:\/\/www.theverge.com\/2023\/11\/4\/23946353\/generative-ai-copyright-training-data-openai-microsoft-google-meta-stabilityai<\/a><\/p>\n<p>5. GEMMA, C. How ChatGPT and other AI tools could disrupt scientific publishing. <em>Nature<\/em> [online]. 2023, vol. 622, no. 7982, pp. 234-236 [viewed 19 January 2024]. <a href=\"https:\/\/doi.org\/10.1038\/d41586-023-03144-w\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.1038\/d41586-023-03144-w<\/a>. Available from: <a href=\"https:\/\/www.nature.com\/articles\/d41586-023-03144-w\" target=\"_blank\" rel=\"noopener\">https:\/\/www.nature.com\/articles\/d41586-023-03144-w<\/a><\/p>\n<p>6. POWERS, M.P. Generative AI Meets Scientific Publishing [online]. <em>Optics &amp; Photonics News<\/em> [online]. 2023, vol. 34 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/www.optica-opn.org\/home\/articles\/volume_34\/october_2023\/features\/generative_ai_meets_scientific_publishing\/\" target=\"_blank\" rel=\"noopener\">https:\/\/www.optica-opn.org\/home\/articles\/volume_34\/october_2023\/features\/generative_ai_meets_scientific_publishing\/<\/a><\/p>\n<p>7. KAUFMAN, R. The United States Copyright Office Notice of Inquiry on AI: A Quick Take [online]. <em>The Scholarly Kitchen<\/em>, 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/scholarlykitchen.sspnet.org\/2023\/11\/28\/the-united-states-copyright-office-notice-of-inquiring-on-ai-a-quick-take\/\" target=\"_blank\" rel=\"noopener\">https:\/\/scholarlykitchen.sspnet.org\/2023\/11\/28\/the-united-states-copyright-office-notice-of-inquiring-on-ai-a-quick-take\/<\/a><\/p>\n<p>8. ESPOSITO, J. The United States Copyright Office Notice of Inquiry on AI: A Quick Take [online]. <em>The Scholarly Kitchen<\/em>, 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/scholarlykitchen.sspnet.org\/2023\/07\/12\/who-is-going-to-make-money-from-artificial-intelligence-in-scholarly-communications\/\" target=\"_blank\" rel=\"noopener\">https:\/\/scholarlykitchen.sspnet.org\/2023\/07\/12\/who-is-going-to-make-money-from-artificial-intelligence-in-scholarly-communications\/<\/a><\/p>\n<p>9. GEMINI [online]. Clarke &amp; Esposito. 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/www.ce-strategy.com\/the-brief\/gemini\/\" target=\"_blank\" rel=\"noopener\">https:\/\/www.ce-strategy.com\/the-brief\/gemini\/<\/a><\/p>\n<p>10. BIDDLE, S. LexisNexis Sold Powerful Spy Tools to U.S. Customs and Border Protection [online]. The Intercept. 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/theintercept.com\/2023\/11\/16\/lexisnexis-cbp-surveillance-border\/\" target=\"_blank\" rel=\"noopener\">https:\/\/theintercept.com\/2023\/11\/16\/lexisnexis-cbp-surveillance-border\/<\/a><\/p>\n<p>11. YOOSE, B. and SHOCKEY, N. Navigating Risk in Vendor Data Privacy Practices: An Analysis of Elsevier&#8217;s ScienceDirect [online]. Zenodo. 2023 [viewed 19 January 2024]. <a href=\"https:\/\/doi.org\/10.5281\/zenodo.10078610\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.5281\/zenodo.10078610<\/a>. Available from: <a href=\"https:\/\/zenodo.org\/doi\/10.5281\/zenodo.10078609\" target=\"_blank\" rel=\"noopener\">https:\/\/zenodo.org\/doi\/10.5281\/zenodo.10078609<\/a><\/p>\n<p>12. Data tracking in research: aggregation and use or sale of usage data by academic publishers [online]. DFG Scientific Library Services and Information Systems (LIS). 2021 [viewed 19 January 2024]. Deutsche Forschungsgemeinschaft. <a href=\"https:\/\/doi.org\/10.5281\/zenodo.5937994\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.5281\/zenodo.5937994<\/a>. Available from: <a href=\"https:\/\/www.dfg.de\/resource\/blob\/174924\/d99b797724796bc1a137fe3d6858f326\/datentracking-papier-en-data.pdf\" target=\"_blank\" rel=\"noopener\">https:\/\/www.dfg.de\/resource\/blob\/174924\/d99b797724796bc1a137fe3d6858f326\/datentracking-papier-en-data.pdf<\/a><\/p>\n<p>13. SPARC Report Urges Action to Address Concerns with ScienceDirect Data Privacy Practices [online]. SPARC. 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/sparcopen.org\/news\/2023\/sparc-report-urges-action-to-address-concerns-with-sciencedirect-data-privacy-practices\/\" target=\"_blank\" rel=\"noopener\">https:\/\/sparcopen.org\/news\/2023\/sparc-report-urges-action-to-address-concerns-with-sciencedirect-data-privacy-practices\/<\/a><\/p>\n<h3>Refer\u00eancias<\/h3>\n<p>Addressing the Alarming Systems of Surveillance Built By Library Vendors [online]. SPARC. 2021 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/sparcopen.org\/news\/2021\/addressing-the-alarming-systems-of-surveillance-built-by-library-vendors\/\" target=\"_blank\" rel=\"noopener\">https:\/\/sparcopen.org\/news\/2021\/addressing-the-alarming-systems-of-surveillance-built-by-library-vendors\/<\/a><\/p>\n<p>Announcing AI2 OLMo, an Open Language Model Made by Scientists, for Scientists [online]. <em>AI2 Blog<\/em>, 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/blog.allenai.org\/announcing-ai2-olmo-an-open-language-model-made-by-scientists-for-scientists-ab761e4e9b76\" target=\"_blank\" rel=\"noopener\">https:\/\/blog.allenai.org\/announcing-ai2-olmo-an-open-language-model-made-by-scientists-for-scientists-ab761e4e9b76<\/a><\/p>\n<p>Annual Reports and Financial Statements 2015 [online]. Relx Group. 2015 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/www.relx.com\/~\/media\/Files\/R\/RELX-Group\/documents\/reports\/annual-reports\/2015-annual-report.pdf\" target=\"_blank\" rel=\"noopener\">https:\/\/www.relx.com\/~\/media\/Files\/R\/RELX-Group\/documents\/reports\/annual-reports\/2015-annual-report.pdf<\/a><\/p>\n<p>BIDDLE, S. LexisNexis Sold Powerful Spy Tools to U.S. Customs and Border Protection [online]. The Intercept. 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/theintercept.com\/2023\/11\/16\/lexisnexis-cbp-surveillance-border\/\" target=\"_blank\" rel=\"noopener\">https:\/\/theintercept.com\/2023\/11\/16\/lexisnexis-cbp-surveillance-border\/<\/a><\/p>\n<p>BREMBS, B. Algorithmic Employment Decisions In Academia? [online]. <em>Bj\u00f6rn Brembs Blogs<\/em>, 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/bjoern.brembs.net\/2021\/09\/algorithmic-employment-decisions-in-academia\/\" target=\"_blank\" rel=\"noopener\">https:\/\/bjoern.brembs.net\/2021\/09\/algorithmic-employment-decisions-in-academia\/<\/a><\/p>\n<p>BREWSTER, F. Big Tech Is Lobbying Hard to Keep Copyright Law Favorable to AI [online]. JACOBIN. 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/jacobin.com\/2023\/11\/artificial-intelligence-big-tech-lobbying-copyright-infringement-regulation\/\" target=\"_blank\" rel=\"noopener\">https:\/\/jacobin.com\/2023\/11\/artificial-intelligence-big-tech-lobbying-copyright-infringement-regulation\/<\/a><\/p>\n<p>BRUELL, A. ChatGPT Creator OpenAI to Pay Politico Parent for Using Its Content [online]. The Wall Street Journal. 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/www.wsj.com\/business\/media\/openai-to-pay-politico-parent-axel-springer-for-using-its-content-bdc33332\" target=\"_blank\" rel=\"noopener\">https:\/\/www.wsj.com\/business\/media\/openai-to-pay-politico-parent-axel-springer-for-using-its-content-bdc33332<\/a><\/p>\n<p>CHAN, L. Platform Capitalism and the Governance of Knowledge Infrastructure. In: Digital Initiative Symposium, San Diego, 2019 [viewed 19 January 2024]. <a href=\"https:\/\/doi.org\/10.5281\/zenodo.2656601\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.5281\/zenodo.2656601<\/a>. Available from: <a href=\"https:\/\/zenodo.org\/records\/2656601\" target=\"_blank\" rel=\"noopener\">https:\/\/zenodo.org\/records\/2656601<\/a><\/p>\n<p>Clarivate Announces Partnership with AI21 Labs as part of its Generative AI Strategy to Drive Growth [online]. Clarivate. 2023 [viewed 19 January 2024]. Available from: https:\/\/allenai.org\/data\/s2orc<\/p>\n<p>Data tracking in research: aggregation and use or sale of usage data by academic publishers [online]. DFG Scientific Library Services and Information Systems (LIS). 2021 [viewed 19 January 2024]. Deutsche Forschungsgemeinschaft. <a href=\"https:\/\/doi.org\/10.5281\/zenodo.5937994\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.5281\/zenodo.5937994<\/a>. Available from: <a href=\"https:\/\/www.dfg.de\/resource\/blob\/174924\/d99b797724796bc1a137fe3d6858f326\/datentracking-papier-en-data.pdf\" target=\"_blank\" rel=\"noopener\">https:\/\/www.dfg.de\/resource\/blob\/174924\/d99b797724796bc1a137fe3d6858f326\/datentracking-papier-en-data.pdf<\/a><\/p>\n<p>DAVIS, W. AI companies have all kinds of arguments against paying for copyrighted content [online]. 2023 [viewed 19 January 2024]. The Verge. Available from: <a href=\"https:\/\/www.theverge.com\/2023\/11\/4\/23946353\/generative-ai-copyright-training-data-openai-microsoft-google-meta-stabilityai\" target=\"_blank\" rel=\"noopener\">https:\/\/www.theverge.com\/2023\/11\/4\/23946353\/generative-ai-copyright-training-data-openai-microsoft-google-meta-stabilityai<\/a><\/p>\n<p>Digital Science acquires AI service Writefull [online]. Research Information. 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/www.researchinformation.info\/news\/digital-science-acquires-ai-service-writefull?utm_campaign=RI%20Newsline%2028-11-23&amp;utm_content=https%3A%2F%2F\" target=\"_blank\" rel=\"noopener\">https:\/\/www.researchinformation.info\/news\/digital-science-acquires-ai-service-writefull?utm_campaign=RI%20Newsline%2028-11-23&amp;utm_content=https%3A%2F%2F<\/a><\/p>\n<p>ESPOSITO, J. The United States Copyright Office Notice of Inquiry on AI: A Quick Take [online]. <em>The Scholarly Kitchen<\/em>, 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/scholarlykitchen.sspnet.org\/2023\/07\/12\/who-is-going-to-make-money-from-artificial-intelligence-in-scholarly-communications\/\" target=\"_blank\" rel=\"noopener\">https:\/\/scholarlykitchen.sspnet.org\/2023\/07\/12\/who-is-going-to-make-money-from-artificial-intelligence-in-scholarly-communications\/<\/a><\/p>\n<p>GEMINI [online]. Clarke &amp; Esposito. 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/www.ce-strategy.com\/the-brief\/gemini\/\" target=\"_blank\" rel=\"noopener\">https:\/\/www.ce-strategy.com\/the-brief\/gemini\/<\/a><\/p>\n<p>GEMMA, C. How ChatGPT and other AI tools could disrupt scientific publishing. <em>Nature<\/em> [online]. 2023, vol. 622, no. 7982, pp. 234-236 [viewed 19 January 2024]. <a href=\"https:\/\/doi.org\/10.1038\/d41586-023-03144-w\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.1038\/d41586-023-03144-w<\/a>. Available from: <a href=\"https:\/\/www.nature.com\/articles\/d41586-023-03144-w\" target=\"_blank\" rel=\"noopener\">https:\/\/www.nature.com\/articles\/d41586-023-03144-w<\/a><\/p>\n<p>GENDRON, Y., ANDREW, J. and Cooper, C. The perils of artificial intelligence in academic publishing. <em>Critical Perspectives on Accounting<\/em> [online]. 2022, vol. 87, pp. 102411 [viewed 19 January 2024]. <a href=\"https:\/\/doi.org\/10.1016\/j.cpa.2021.102411\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.1016\/j.cpa.2021.102411<\/a>. Available from: <a href=\"https:\/\/www.sciencedirect.com\/science\/article\/abs\/pii\/S1045235421001301?via%3Dihub\" target=\"_blank\" rel=\"noopener\">https:\/\/www.sciencedirect.com\/science\/article\/abs\/pii\/S1045235421001301?via%3Dihub<\/a><\/p>\n<p>HARDINGES, J., SIMPERL, E. and SHADBOLT, N. We Must Fix the Lack of Transparency Around the Data Used to Train Foundation Models. Harvard Data Science Review [online]. 2023 [viewed 19 January 2024]. <a href=\"https:\/\/doi.org\/10.1162\/99608f92.a50ec6e6\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.1162\/99608f92.a50ec6e6<\/a>. Available from: <a href=\"https:\/\/hdsr.mitpress.mit.edu\/pub\/xau9dza3\/release\/1\" target=\"_blank\" rel=\"noopener\">https:\/\/hdsr.mitpress.mit.edu\/pub\/xau9dza3\/release\/1<\/a><\/p>\n<p>KAK, A., WEST, S.M. and WHITTAKER, M. Make no mistake\u2014AI is owned by Big Tech [online]. MIT Technology Review. 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/www.technologyreview.com\/2023\/12\/05\/1084393\/make-no-mistake-ai-is-owned-by-big-tech\/\" target=\"_blank\" rel=\"noopener\">https:\/\/www.technologyreview.com\/2023\/12\/05\/1084393\/make-no-mistake-ai-is-owned-by-big-tech\/<\/a><\/p>\n<p>KAUFMAN, R. Some Thoughts on Five Pending AI Litigations \u2014 Avoiding Squirrels and Other AI Distraction [online]. <em>The Scholarly Kitchen<\/em>, 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/scholarlykitchen.sspnet.org\/2023\/03\/07\/some-thoughts-on-five-pending-ai-litigations-avoiding-squirrels-and-other-ai-distractions\/\" target=\"_blank\" rel=\"noopener\">https:\/\/scholarlykitchen.sspnet.org\/2023\/03\/07\/some-thoughts-on-five-pending-ai-litigations-avoiding-squirrels-and-other-ai-distractions\/<\/a><\/p>\n<p>KAUFMAN, R. The United States Copyright Office Notice of Inquiry on AI: A Quick Take [online]. <em>The Scholarly Kitchen<\/em>, 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/scholarlykitchen.sspnet.org\/2023\/11\/28\/the-united-states-copyright-office-notice-of-inquiring-on-ai-a-quick-take\/\" target=\"_blank\" rel=\"noopener\">https:\/\/scholarlykitchen.sspnet.org\/2023\/11\/28\/the-united-states-copyright-office-notice-of-inquiring-on-ai-a-quick-take\/<\/a><\/p>\n<p>KNECHT, S. Dutch open science deal primarily benefits Elsevier [online]. ScienceGuide. 2020 [viewed 19 January 2024]. <a href=\"https:\/\/www.scienceguide.nl\/2020\/06\/open-science-deal-benefits-elsevier\/\" target=\"_blank\" rel=\"noopener\">https:\/\/www.scienceguide.nl\/2020\/06\/open-science-deal-benefits-elsevier\/<\/a><\/p>\n<p>LAMDAN, S. Data cartels: The companies that control and monopolize our information. Stanford University Press, 2022. Available from: <a href=\"https:\/\/www.sup.org\/books\/title\/?id=33205\" target=\"_blank\" rel=\"noopener\">https:\/\/www.sup.org\/books\/title\/?id=33205<\/a><\/p>\n<p>LAWTON, G. Elsevier sees promise in small language models and graph data [online]. Diginomica. 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/diginomica.com\/reed-elsevier-sees-promise-small-language-models-and-graph-data\" target=\"_blank\" rel=\"noopener\">https:\/\/diginomica.com\/reed-elsevier-sees-promise-small-language-models-and-graph-data<\/a><\/p>\n<p>LLC, OAI CORPORATION, LLC, and OPENAI HOLDINGS, LLC [online]. The New York Times. 2023 [viewed 19 January 2024]. <a href=\"https:\/\/nytco-assets.nytimes.com\/2023\/12\/NYT_Complaint_Dec2023.pdf\" target=\"_blank\" rel=\"noopener\">https:\/\/nytco-assets.nytimes.com\/2023\/12\/NYT_Complaint_Dec2023.pdf<\/a><\/p>\n<p>LO, K<em>., et al.<\/em> S2ORC: The Semantic Scholar Open Research Corpus. In: Annual Meeting of the Association for Computational Linguistics, Toronto, Canad\u00e1, 2023 [viewed 19 January 2024]. <a href=\"https:\/\/doi.org\/10.18653\/V1%2F2020.ACL-MAIN.447\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.18653\/V1%2F2020.ACL-MAIN.447<\/a>. Available from: <a href=\"https:\/\/www.semanticscholar.org\/paper\/S2ORC%3A-The-Semantic-Scholar-Open-Research-Corpus-Lo-Wang\/5c5751d45e298cea054f32b392c12c61027d2fe7\" target=\"_blank\" rel=\"noopener\">https:\/\/www.semanticscholar.org\/paper\/S2ORC%3A-The-Semantic-Scholar-Open-Research-Corpus-Lo-Wang\/5c5751d45e298cea054f32b392c12c61027d2fe7<\/a><\/p>\n<p>MA, L. The Platformisation of Scholarly Information and How to Figh. <em>LIBER Quarterly: The Journal of the Association of European Research Libraries<\/em> [online]. 2023, vol. 33, no. 1, pp. 1-20 [viewed 19 January 2024]. <a href=\"https:\/\/doi.org\/10.53377\/lq.13561\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.53377\/lq.13561<\/a>. Available from: <a href=\"https:\/\/liberquarterly.eu\/article\/view\/13561\" target=\"_blank\" rel=\"noopener\">https:\/\/liberquarterly.eu\/article\/view\/13561<\/a><\/p>\n<p>MATEI, S.A. An academic ChatGPT needs a better schooling [online]. <em>Times Higher Education<\/em>, 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/www.timeshighereducation.com\/blog\/academic-chatgpt-needs-better-schooling\" target=\"_blank\" rel=\"noopener\">https:\/\/www.timeshighereducation.com\/blog\/academic-chatgpt-needs-better-schooling<\/a><\/p>\n<p>MERTON, R.K. The Matthew Effect in Science: The reward and communication systems of science are considered. <em>Science<\/em> [online]. 1968, vol. 159, no. 3810, pp. 56-63 [viewed 19 January 2024]. <a href=\"https:\/\/doi.org\/10.1126\/science.159.3810.56\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.1126\/science.159.3810.56<\/a>. Available from: <a href=\"https:\/\/www.science.org\/doi\/10.1126\/science.159.3810.56\" target=\"_blank\" rel=\"noopener\">https:\/\/www.science.org\/doi\/10.1126\/science.159.3810.56<\/a><\/p>\n<p>MUELLER, T. Elsevier introduces authoritative scientific Datasets to fuel innovation and business-critical decisions in life sciences, chemicals and other research-intensive industries [online]. Elsevier. 2023 [viewed 19 January 2024]. <a href=\"https:\/\/www.elsevier.com\/about\/press-releases\/elsevier-introduces-authoritative-scientific-datasets-to-fuel-innovation-and\" target=\"_blank\" rel=\"noopener\">https:\/\/www.elsevier.com\/about\/press-releases\/elsevier-introduces-authoritative-scientific-datasets-to-fuel-innovation-and<\/a><\/p>\n<p>NICHOLSON, J.M., <em>et al.<\/em> A smart citation index that displays the context of citations and classifies their intent using deep learning. <em>Quantitative Science Studies<\/em> [online]. 2021, vol. 2, no. 3, pp. 882-898 [viewed 19 January 2024]. <a href=\"https:\/\/doi.org\/10.1162\/qss_a_00146\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.1162\/qss_a_00146<\/a>. Available from: <a href=\"https:\/\/direct.mit.edu\/qss\/article\/2\/3\/882\/102990\/scite-A-smart-citation-index-that-displays-the\" target=\"_blank\" rel=\"noopener\">https:\/\/direct.mit.edu\/qss\/article\/2\/3\/882\/102990\/scite-A-smart-citation-index-that-displays-the<\/a><\/p>\n<p>NOORDEN, R.V. ChatGPT-like AIs are coming to major science search engines. <em>Nature<\/em> [online]. 2023, vol. 620, no. 7973, pp. 258 [viewed 19 January 2024]. <a href=\"https:\/\/doi.org\/10.1038\/d41586-023-02470-3\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.1038\/d41586-023-02470-3<\/a>. Available from: <a href=\"https:\/\/www.nature.com\/articles\/d41586-023-02470-3\" target=\"_blank\" rel=\"noopener\">https:\/\/www.nature.com\/articles\/d41586-023-02470-3<\/a><\/p>\n<p>POOLEY, J. Surveillance Publishing [online]. <em>Elephant in the lab<\/em>, 2020 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/elephantinthelab.org\/surveillance-publishing\/\" target=\"_blank\" rel=\"noopener\">https:\/\/elephantinthelab.org\/surveillance-publishing\/<\/a><\/p>\n<p>POWERS, M.P. Generative AI Meets Scientific Publishing [online]. <em>Optics &amp; Photonics News<\/em> [online]. 2023, vol. 34 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/www.optica-opn.org\/home\/articles\/volume_34\/october_2023\/features\/generative_ai_meets_scientific_publishing\/\" target=\"_blank\" rel=\"noopener\">https:\/\/www.optica-opn.org\/home\/articles\/volume_34\/october_2023\/features\/generative_ai_meets_scientific_publishing\/<\/a><\/p>\n<p>PRIDE, D. CORE-GPT: Combining Open Access research and AI for credible, trustworthy question answering [online]. The <em>CORE blog<\/em>, 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/blog.core.ac.uk\/2023\/03\/17\/core-gpt-combining-open-access-research-and-ai-for-credible-trustworthy-question-answering\/\" target=\"_blank\" rel=\"noopener\">https:\/\/blog.core.ac.uk\/2023\/03\/17\/core-gpt-combining-open-access-research-and-ai-for-credible-trustworthy-question-answering\/<\/a><\/p>\n<p>Research Solutions announces acquisition of scite [online]. AI-TechPark. 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/ai-techpark.com\/research-solutions-announces-acquisition-of-scite\/\" target=\"_blank\" rel=\"noopener\">https:\/\/ai-techpark.com\/research-solutions-announces-acquisition-of-scite\/<\/a><\/p>\n<p>ROSSITER, M.W. The Matthew Matilda Effect in Science. <em>Social studies of science<\/em> [online]. 1993, vol. 23, no. 2, pp. 325-341 [viewed 19 January 2024]. <a href=\"https:\/\/doi.org\/10.1177\/030631293023002004\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.1177\/030631293023002004<\/a>. Available from: <a href=\"https:\/\/journals.sagepub.com\/doi\/abs\/10.1177\/030631293023002004\" target=\"_blank\" rel=\"noopener\">https:\/\/journals.sagepub.com\/doi\/abs\/10.1177\/030631293023002004<\/a><\/p>\n<p>SIEMS, R. When your journal reads you [online]. <em>Elephant in the lab<\/em>, 2021 [viewed 19 January 2024]. <a href=\"https:\/\/doi.org\/10.5281\/zenodo.4683778\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.5281\/zenodo.4683778<\/a>. Available from: <a href=\"https:\/\/elephantinthelab.org\/when-your-journal-reads-you\/\" target=\"_blank\" rel=\"noopener\">https:\/\/elephantinthelab.org\/when-your-journal-reads-you\/<\/a><\/p>\n<p>SPARC Report Urges Action to Address Concerns with ScienceDirect Data Privacy Practices [online]. SPARC. 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/sparcopen.org\/news\/2023\/sparc-report-urges-action-to-address-concerns-with-sciencedirect-data-privacy-practices\/\" target=\"_blank\" rel=\"noopener\">https:\/\/sparcopen.org\/news\/2023\/sparc-report-urges-action-to-address-concerns-with-sciencedirect-data-privacy-practices\/<\/a><\/p>\n<p>Springer Nature expands its AI capability with acquisition of Slimmer AI\u2019s Science division [online]. Springer Nature Group. 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/group.springernature.com\/gp\/group\/media\/press-releases\/acquisition-slimmer-ai-science-division\/26215608\" target=\"_blank\" rel=\"noopener\">https:\/\/group.springernature.com\/gp\/group\/media\/press-releases\/acquisition-slimmer-ai-science-division\/26215608<\/a><\/p>\n<p>STAIMAN, A. Will Building LLMs Become the New Revenue Driver for Academic Publishing? [online]. <em>The Scholarly Kitchen<\/em>, 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/scholarlykitchen.sspnet.org\/2023\/08\/08\/will-building-llms-become-the-new-revenue-driver-for-academic-publishing\/\" target=\"_blank\" rel=\"noopener\">https:\/\/scholarlykitchen.sspnet.org\/2023\/08\/08\/will-building-llms-become-the-new-revenue-driver-for-academic-publishing\/<\/a><\/p>\n<p>The Times Sues OpenAI and Microsoft Over A.I. Use of Copyrighted Work [online]. The New York Times. 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/www.nytimes.com\/2023\/12\/27\/business\/media\/new-york-times-open-ai-microsoft-lawsuit.html\" target=\"_blank\" rel=\"noopener\">https:\/\/www.nytimes.com\/2023\/12\/27\/business\/media\/new-york-times-open-ai-microsoft-lawsuit.html<\/a><\/p>\n<p>WIDDER, D.G., WEST, S. and WHITTAKER, M. Open (For Business): Big Tech, Concentrated Power, and the Political Economy of Open AI [online]. SSRN Papers. 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/papers.ssrn.com\/sol3\/papers.cfm?abstract_id=4543807\" target=\"_blank\" rel=\"noopener\">https:\/\/papers.ssrn.com\/sol3\/papers.cfm?abstract_id=4543807<\/a><\/p>\n<p>WILLIAMS, T. Publishers seek protection from AI mining of academic research [online]. Times Higher Education. 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/www.timeshighereducation.com\/news\/publishers-seek-protection-ai-mining-academic-research\" target=\"_blank\" rel=\"noopener\">https:\/\/www.timeshighereducation.com\/news\/publishers-seek-protection-ai-mining-academic-research<\/a><\/p>\n<p>YOOSE, B. and SHOCKEY, N. Navigating Risk in Vendor Data Privacy Practices: An Analysis of Elsevier&#8217;s ScienceDirect [online]. Zenodo. 2023 [viewed 19 January 2024]. <a href=\"https:\/\/doi.org\/10.5281\/zenodo.10078610\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.5281\/zenodo.10078610<\/a>. Available from: <a href=\"https:\/\/zenodo.org\/doi\/10.5281\/zenodo.10078609\" target=\"_blank\" rel=\"noopener\">https:\/\/zenodo.org\/doi\/10.5281\/zenodo.10078609<\/a><\/p>\n<p>ZHAVORONKOV, A. The Unexpected Winners Of The ChatGPT Generative AI Revolution [online]. Forbes. 2023 [viewed 19 January 2024]. Available from: <a href=\"https:\/\/www.forbes.com\/sites\/alexzhavoronkov\/2023\/02\/23\/the-unexpected-winners-of-the-chatgpt-generative-ai-revolution\/?sh=5acc971212b0&amp;ref=lorcandempsey.net\" target=\"_blank\" rel=\"noopener\">https:\/\/www.forbes.com\/sites\/alexzhavoronkov\/2023\/02\/23\/the-unexpected-winners-of-the-chatgpt-generative-ai-revolution\/?sh=5acc971212b0&amp;ref=lorcandempsey.net<\/a><\/p>\n<p>ZUBOFF, S. The Age of Surveillance Capitalism. PublicAffairs, 2019. Available from: <a href=\"https:\/\/www.hachettebookgroup.com\/titles\/shoshana-zuboff\/the-age-of-surveillance-capitalism\/9781610395694\/?lens=publicaffairs\" target=\"_blank\" rel=\"noopener\">https:\/\/www.hachettebookgroup.com\/titles\/shoshana-zuboff\/the-age-of-surveillance-capitalism\/9781610395694\/?lens=publicaffairs<\/a><\/p>\n<h3>Enlaces externos<\/h3>\n<p>AI21 Labs: <a href=\"https:\/\/www.ai21.com\/\" target=\"_blank\" rel=\"noopener\">https:\/\/www.ai21.com\/<\/a><\/p>\n<p>CC BY 4.0 Deed | Creative Commons: <a href=\"https:\/\/creativecommons.org\/licenses\/by\/4.0\/\" target=\"_blank\" rel=\"noopener\">https:\/\/creativecommons.org\/licenses\/by\/4.0\/<\/a><\/p>\n<p>Consensus: <a href=\"https:\/\/consensus.app\/home\/about-us\/\" target=\"_blank\" rel=\"noopener\">https:\/\/consensus.app\/home\/about-us\/<\/a><\/p>\n<p>CORE: <a href=\"https:\/\/core.ac.uk\/about\" target=\"_blank\" rel=\"noopener\">https:\/\/core.ac.uk\/about<\/a><\/p>\n<p>Curie: <a href=\"https:\/\/www.aje.com\/curie\/\" target=\"_blank\" rel=\"noopener\">https:\/\/www.aje.com\/curie\/<\/a><\/p>\n<p>Dimensions AI Assistant: <a href=\"https:\/\/www.dimensions.ai\/discover-dimensions-ai-assistant\/\" target=\"_blank\" rel=\"noopener\">https:\/\/www.dimensions.ai\/discover-dimensions-ai-assistant\/<\/a><\/p>\n<p>Fair Use \u2013 Wikipedia: <a href=\"https:\/\/en.wikipedia.org\/wiki\/Fair_use\" target=\"_blank\" rel=\"noopener\">https:\/\/en.wikipedia.org\/wiki\/Fair_use<\/a><\/p>\n<p>Imagetwin: <a href=\"https:\/\/imagetwin.ai\/\" target=\"_blank\" rel=\"noopener\">https:\/\/imagetwin.ai\/<\/a><\/p>\n<p>iris.ai: <a href=\"https:\/\/iris.ai\/\" target=\"_blank\" rel=\"noopener\">https:\/\/iris.ai\/<\/a><\/p>\n<p>Jenni: <a href=\"https:\/\/jenni.ai\/\" target=\"_blank\" rel=\"noopener\">https:\/\/jenni.ai\/<\/a><\/p>\n<p>Keenious: <a href=\"https:\/\/keenious.com\/\" target=\"_blank\" rel=\"noopener\">https:\/\/keenious.com\/<\/a><\/p>\n<p>Ought: <a href=\"https:\/\/ought.org\/elicit\" target=\"_blank\" rel=\"noopener\">https:\/\/ought.org\/elicit<\/a><\/p>\n<p>Petal: <a href=\"https:\/\/www.petal.org\/\" target=\"_blank\" rel=\"noopener\">https:\/\/www.petal.org\/<\/a><\/p>\n<p>Scholarcy: <a href=\"https:\/\/www.scholarcy.com\/\" target=\"_blank\" rel=\"noopener\">https:\/\/www.scholarcy.com\/<\/a><\/p>\n<p>SciSummary: <a href=\"https:\/\/scisummary.com\/\" target=\"_blank\" rel=\"noopener\">https:\/\/scisummary.com\/<\/a><\/p>\n<p>scite: <a href=\"https:\/\/scite.ai\/\" target=\"_blank\" rel=\"noopener\">https:\/\/scite.ai\/<\/a><\/p>\n<p>Scopus AI: <a href=\"https:\/\/www.elsevier.com\/products\/scopus\/scopus-ai\" target=\"_blank\" rel=\"noopener\">https:\/\/www.elsevier.com\/products\/scopus\/scopus-ai<\/a><\/p>\n<p>Semantic Scholar | Seemantic Reeader: <a href=\"https:\/\/www.semanticscholar.org\/product\/semantic-reader\" target=\"_blank\" rel=\"noopener\">https:\/\/www.semanticscholar.org\/product\/semantic-reader<\/a><\/p>\n<p>Semantic Scholar: <a href=\"https:\/\/www.semanticscholar.org\/\" target=\"_blank\" rel=\"noopener\">https:\/\/www.semanticscholar.org\/<\/a><\/p>\n<p>Slimmer AI: <a href=\"https:\/\/www.slimmer.ai\/\" target=\"_blank\" rel=\"noopener\">https:\/\/www.slimmer.ai\/<\/a><\/p>\n<p>Stop Tracking Science: <a href=\"https:\/\/stoptrackingscience.eu\/\" target=\"_blank\" rel=\"noopener\">https:\/\/stoptrackingscience.eu\/<\/a><\/p>\n<p>The Horizons Series &#8211; The Case Library &amp; Geyer Center for Information Technology Colloquiym Series @ Colgate University: <a href=\"https:\/\/jfinnell.colgate.domains\/horizons\/\" target=\"_blank\" rel=\"noopener\">https:\/\/jfinnell.colgate.domains\/horizons\/<\/a><\/p>\n<p>Writefull: <a href=\"https:\/\/www.writefull.com\/\" target=\"_blank\" rel=\"noopener\">https:\/\/www.writefull.com\/<\/a><\/p>\n<p>&nbsp;<\/p>\n<h3>Art\u00edculo original en ingl\u00e9s<\/h3>\n<p><a href=\"https:\/\/doi.org\/10.54900\/zg929-e9595\" target=\"_blank\" rel=\"noopener\">Large Language Publishing<\/a><\/p>\n<p>&nbsp;<\/p>\n<p>Traducido del original en <a href=\"https:\/\/doi.org\/10.54900\/zg929-e9595\" target=\"_blank\" rel=\"noopener\">ingl\u00e9s<\/a> por Ernesto Spinak.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>El NYT dio la bienvenida al A\u00f1o Nuevo con una demanda contra <em>OpenAI<\/em> y <em>Microsoft<\/em>. <em>OpenAI<\/em> y su patrocinador Microsoft hab\u00edan robado, seg\u00fan el expediente, \u201cmillones de art\u00edculos de noticias protegidos por derechos de autor del <em>Times<\/em>, investigaciones en profundidad, art\u00edculos de opini\u00f3n, rese\u00f1as, gu\u00edas pr\u00e1cticas\u201d y m\u00e1s, todo para entrenar los LLMs de <em>OpenAI<\/em>. <span class=\"ellipsis\">&hellip;<\/span> <span class=\"more-link-wrap\"><a href=\"https:\/\/blog.scielo.org\/es\/2024\/01\/19\/publicacion-en-llm\/\" class=\"more-link\"><span>Read More &rarr;<\/span><\/a><\/span><\/p>\n","protected":false},"author":99,"featured_media":5476,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"om_disable_all_campaigns":false,"_monsterinsights_skip_tracking":false,"footnotes":"","_links_to":"","_links_to_target":""},"categories":[3,2],"tags":[7,37,78],"class_list":["post-5475","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-analisis","category-noticias","tag-comunicacion-cientifica","tag-etica-en-la-comunicacion-cientifica","tag-inteligencia-artificial"],"aioseo_notices":[],"aioseo_head":"\n\t\t<!-- All in One SEO Pro 4.9.10 - aioseo.com -->\n\t<meta name=\"description\" content=\"El NYT dio la bienvenida al A\u00f1o Nuevo con una demanda contra OpenAI y Microsoft. OpenAI y su patrocinador Microsoft hab\u00edan robado, seg\u00fan el expediente, \u201cmillones de art\u00edculos de noticias protegidos por derechos de autor del Times, investigaciones en profundidad, art\u00edculos de opini\u00f3n, rese\u00f1as, gu\u00edas pr\u00e1cticas\u201d y m\u00e1s, todo para entrenar los LLMs de OpenAI.\" \/>\n\t<meta name=\"robots\" content=\"max-image-preview:large\" \/>\n\t<meta name=\"author\" content=\"Jeff Pooley\"\/>\n\t<meta name=\"keywords\" content=\"comunicaci\u00f3n cient\u00edfica,\u00e9tica en la comunicaci\u00f3n cient\u00edfica,inteligencia artificial,an\u00e1lisis,noticias\" \/>\n\t<link rel=\"canonical\" href=\"https:\/\/blog.scielo.org\/es\/2024\/01\/19\/publicacion-en-llm\/\" \/>\n\t<meta name=\"generator\" content=\"All in One SEO Pro (AIOSEO) 4.9.10\" \/>\n\t\t<meta property=\"og:locale\" content=\"en_US\" \/>\n\t\t<meta property=\"og:site_name\" content=\"SciELO en Perspectiva\" \/>\n\t\t<meta property=\"og:type\" content=\"article\" \/>\n\t\t<meta property=\"og:title\" content=\"Publicaci\u00f3n en Large Language Model (LLM) [Publicado originalmente en el blog Upstream en enero\/2024] | SciELO en Perspectiva\" \/>\n\t\t<meta property=\"og:description\" content=\"El NYT dio la bienvenida al A\u00f1o Nuevo con una demanda contra OpenAI y Microsoft. OpenAI y su patrocinador Microsoft hab\u00edan robado, seg\u00fan el expediente, \u201cmillones de art\u00edculos de noticias protegidos por derechos de autor del Times, investigaciones en profundidad, art\u00edculos de opini\u00f3n, rese\u00f1as, gu\u00edas pr\u00e1cticas\u201d y m\u00e1s, todo para entrenar los LLMs de OpenAI.\" \/>\n\t\t<meta property=\"og:url\" content=\"https:\/\/blog.scielo.org\/es\/2024\/01\/19\/publicacion-en-llm\/\" \/>\n\t\t<meta property=\"fb:admins\" content=\"SciELONetwork\" \/>\n\t\t<meta property=\"article:published_time\" content=\"2024-01-19T12:30:49+00:00\" \/>\n\t\t<meta property=\"article:modified_time\" content=\"2024-01-19T12:32:41+00:00\" \/>\n\t\t<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/SciELONetwork\" \/>\n\t\t<meta name=\"twitter:card\" content=\"summary\" \/>\n\t\t<meta name=\"twitter:site\" content=\"@RedeSciELO\" \/>\n\t\t<meta name=\"twitter:title\" content=\"Publicaci\u00f3n en Large Language Model (LLM) [Publicado originalmente en el blog Upstream en enero\/2024] | SciELO en Perspectiva\" \/>\n\t\t<meta name=\"twitter:description\" content=\"El NYT dio la bienvenida al A\u00f1o Nuevo con una demanda contra OpenAI y Microsoft. OpenAI y su patrocinador Microsoft hab\u00edan robado, seg\u00fan el expediente, \u201cmillones de art\u00edculos de noticias protegidos por derechos de autor del Times, investigaciones en profundidad, art\u00edculos de opini\u00f3n, rese\u00f1as, gu\u00edas pr\u00e1cticas\u201d y m\u00e1s, todo para entrenar los LLMs de OpenAI.\" \/>\n\t\t<meta name=\"twitter:creator\" content=\"@RedeSciELO\" \/>\n\t\t<script type=\"application\/ld+json\" class=\"aioseo-schema\">\n\t\t\t{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2024\\\/01\\\/19\\\/publicacion-en-llm\\\/#article\",\"name\":\"Publicaci\\u00f3n en Large Language Model (LLM) [Publicado originalmente en el blog Upstream en enero\\\/2024] | SciELO en Perspectiva\",\"headline\":\"Publicaci\\u00f3n en Large Language Model (LLM) [Publicado originalmente en el blog Upstream en enero\\\/2024]\",\"author\":{\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/author\\\/jeffpooley\\\/#author\"},\"publisher\":{\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/#organization\"},\"image\":{\"@type\":\"ImageObject\",\"url\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/wp-content\\\/uploads\\\/sites\\\/3\\\/2024\\\/01\\\/pexels-viktor-talashuk-2377295_thumb.jpg\",\"width\":150,\"height\":90,\"caption\":\"Fotograf\\u00eda superpuesta de varios libros con las p\\u00e1ginas dobladas en forma de avi\\u00f3n sobre un fondo negro infinito.\"},\"datePublished\":\"2024-01-19T09:30:49-03:00\",\"dateModified\":\"2024-01-19T09:32:41-03:00\",\"inLanguage\":\"en-US\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2024\\\/01\\\/19\\\/publicacion-en-llm\\\/#webpage\"},\"isPartOf\":{\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2024\\\/01\\\/19\\\/publicacion-en-llm\\\/#webpage\"},\"articleSection\":\"An\\u00e1lisis, Noticias, Comunicaci\\u00f3n Cient\\u00edfica, \\u00c9tica en la Comunicaci\\u00f3n Cient\\u00edfica, Inteligencia Artificial\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2024\\\/01\\\/19\\\/publicacion-en-llm\\\/#breadcrumblist\",\"itemListElement\":[{\"@type\":\"ListItem\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es#listItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/blog.scielo.org\\\/es\",\"nextItem\":{\"@type\":\"ListItem\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/category\\\/analisis\\\/#listItem\",\"name\":\"An\\u00e1lisis\"}},{\"@type\":\"ListItem\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/category\\\/analisis\\\/#listItem\",\"position\":2,\"name\":\"An\\u00e1lisis\",\"item\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/category\\\/analisis\\\/\",\"nextItem\":{\"@type\":\"ListItem\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2024\\\/01\\\/19\\\/publicacion-en-llm\\\/#listItem\",\"name\":\"Publicaci\\u00f3n en Large Language Model (LLM) [Publicado originalmente en el blog Upstream en enero\\\/2024]\"},\"previousItem\":{\"@type\":\"ListItem\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es#listItem\",\"name\":\"Home\"}},{\"@type\":\"ListItem\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2024\\\/01\\\/19\\\/publicacion-en-llm\\\/#listItem\",\"position\":3,\"name\":\"Publicaci\\u00f3n en Large Language Model (LLM) [Publicado originalmente en el blog Upstream en enero\\\/2024]\",\"previousItem\":{\"@type\":\"ListItem\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/category\\\/analisis\\\/#listItem\",\"name\":\"An\\u00e1lisis\"}}]},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/#organization\",\"name\":\"SciELO en Perspectiva\",\"url\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/\",\"sameAs\":[\"https:\\\/\\\/www.facebook.com\\\/SciELONetwork\",\"https:\\\/\\\/twitter.com\\\/RedeSciELO\"]},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/author\\\/jeffpooley\\\/#author\",\"url\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/author\\\/jeffpooley\\\/\",\"name\":\"Jeff Pooley\",\"image\":{\"@type\":\"ImageObject\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2024\\\/01\\\/19\\\/publicacion-en-llm\\\/#authorImage\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/52fb94d443246a5208e26806f06d8d30daa072dec305387662ce6c71bd98272a?s=96&d=mm&r=g\",\"width\":96,\"height\":96,\"caption\":\"Jeff Pooley\"}},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2024\\\/01\\\/19\\\/publicacion-en-llm\\\/#webpage\",\"url\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2024\\\/01\\\/19\\\/publicacion-en-llm\\\/\",\"name\":\"Publicaci\\u00f3n en Large Language Model (LLM) [Publicado originalmente en el blog Upstream en enero\\\/2024] | SciELO en Perspectiva\",\"description\":\"El NYT dio la bienvenida al A\\u00f1o Nuevo con una demanda contra OpenAI y Microsoft. OpenAI y su patrocinador Microsoft hab\\u00edan robado, seg\\u00fan el expediente, \\u201cmillones de art\\u00edculos de noticias protegidos por derechos de autor del Times, investigaciones en profundidad, art\\u00edculos de opini\\u00f3n, rese\\u00f1as, gu\\u00edas pr\\u00e1cticas\\u201d y m\\u00e1s, todo para entrenar los LLMs de OpenAI.\",\"inLanguage\":\"en-US\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/#website\"},\"breadcrumb\":{\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2024\\\/01\\\/19\\\/publicacion-en-llm\\\/#breadcrumblist\"},\"author\":{\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/author\\\/jeffpooley\\\/#author\"},\"creator\":{\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/author\\\/jeffpooley\\\/#author\"},\"image\":{\"@type\":\"ImageObject\",\"url\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/wp-content\\\/uploads\\\/sites\\\/3\\\/2024\\\/01\\\/pexels-viktor-talashuk-2377295_thumb.jpg\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2024\\\/01\\\/19\\\/publicacion-en-llm\\\/#mainImage\",\"width\":150,\"height\":90,\"caption\":\"Fotograf\\u00eda superpuesta de varios libros con las p\\u00e1ginas dobladas en forma de avi\\u00f3n sobre un fondo negro infinito.\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2024\\\/01\\\/19\\\/publicacion-en-llm\\\/#mainImage\"},\"datePublished\":\"2024-01-19T09:30:49-03:00\",\"dateModified\":\"2024-01-19T09:32:41-03:00\"},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/#website\",\"url\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/\",\"name\":\"SciELO en Perspectiva\",\"inLanguage\":\"en-US\",\"publisher\":{\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/#organization\"}}]}\n\t\t<\/script>\n\t\t<!-- All in One SEO Pro -->\r\n\t\t<title>Publicaci\u00f3n en Large Language Model (LLM) [Publicado originalmente en el blog Upstream en enero\/2024] | SciELO en Perspectiva<\/title>\n\n","aioseo_head_json":{"title":"Publicaci\u00f3n en Large Language Model (LLM) [Publicado originalmente en el blog Upstream en enero\/2024] | SciELO en Perspectiva","description":"El NYT dio la bienvenida al A\u00f1o Nuevo con una demanda contra OpenAI y Microsoft. OpenAI y su patrocinador Microsoft hab\u00edan robado, seg\u00fan el expediente, \u201cmillones de art\u00edculos de noticias protegidos por derechos de autor del Times, investigaciones en profundidad, art\u00edculos de opini\u00f3n, rese\u00f1as, gu\u00edas pr\u00e1cticas\u201d y m\u00e1s, todo para entrenar los LLMs de OpenAI.","canonical_url":"https:\/\/blog.scielo.org\/es\/2024\/01\/19\/publicacion-en-llm\/","robots":"max-image-preview:large","keywords":"comunicaci\u00f3n cient\u00edfica,\u00e9tica en la comunicaci\u00f3n cient\u00edfica,inteligencia artificial,an\u00e1lisis,noticias","webmasterTools":{"miscellaneous":""},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/blog.scielo.org\/es\/2024\/01\/19\/publicacion-en-llm\/#article","name":"Publicaci\u00f3n en Large Language Model (LLM) [Publicado originalmente en el blog Upstream en enero\/2024] | SciELO en Perspectiva","headline":"Publicaci\u00f3n en Large Language Model (LLM) [Publicado originalmente en el blog Upstream en enero\/2024]","author":{"@id":"https:\/\/blog.scielo.org\/es\/author\/jeffpooley\/#author"},"publisher":{"@id":"https:\/\/blog.scielo.org\/es\/#organization"},"image":{"@type":"ImageObject","url":"https:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2024\/01\/pexels-viktor-talashuk-2377295_thumb.jpg","width":150,"height":90,"caption":"Fotograf\u00eda superpuesta de varios libros con las p\u00e1ginas dobladas en forma de avi\u00f3n sobre un fondo negro infinito."},"datePublished":"2024-01-19T09:30:49-03:00","dateModified":"2024-01-19T09:32:41-03:00","inLanguage":"en-US","mainEntityOfPage":{"@id":"https:\/\/blog.scielo.org\/es\/2024\/01\/19\/publicacion-en-llm\/#webpage"},"isPartOf":{"@id":"https:\/\/blog.scielo.org\/es\/2024\/01\/19\/publicacion-en-llm\/#webpage"},"articleSection":"An\u00e1lisis, Noticias, Comunicaci\u00f3n Cient\u00edfica, \u00c9tica en la Comunicaci\u00f3n Cient\u00edfica, Inteligencia Artificial"},{"@type":"BreadcrumbList","@id":"https:\/\/blog.scielo.org\/es\/2024\/01\/19\/publicacion-en-llm\/#breadcrumblist","itemListElement":[{"@type":"ListItem","@id":"https:\/\/blog.scielo.org\/es#listItem","position":1,"name":"Home","item":"https:\/\/blog.scielo.org\/es","nextItem":{"@type":"ListItem","@id":"https:\/\/blog.scielo.org\/es\/category\/analisis\/#listItem","name":"An\u00e1lisis"}},{"@type":"ListItem","@id":"https:\/\/blog.scielo.org\/es\/category\/analisis\/#listItem","position":2,"name":"An\u00e1lisis","item":"https:\/\/blog.scielo.org\/es\/category\/analisis\/","nextItem":{"@type":"ListItem","@id":"https:\/\/blog.scielo.org\/es\/2024\/01\/19\/publicacion-en-llm\/#listItem","name":"Publicaci\u00f3n en Large Language Model (LLM) [Publicado originalmente en el blog Upstream en enero\/2024]"},"previousItem":{"@type":"ListItem","@id":"https:\/\/blog.scielo.org\/es#listItem","name":"Home"}},{"@type":"ListItem","@id":"https:\/\/blog.scielo.org\/es\/2024\/01\/19\/publicacion-en-llm\/#listItem","position":3,"name":"Publicaci\u00f3n en Large Language Model (LLM) [Publicado originalmente en el blog Upstream en enero\/2024]","previousItem":{"@type":"ListItem","@id":"https:\/\/blog.scielo.org\/es\/category\/analisis\/#listItem","name":"An\u00e1lisis"}}]},{"@type":"Organization","@id":"https:\/\/blog.scielo.org\/es\/#organization","name":"SciELO en Perspectiva","url":"https:\/\/blog.scielo.org\/es\/","sameAs":["https:\/\/www.facebook.com\/SciELONetwork","https:\/\/twitter.com\/RedeSciELO"]},{"@type":"Person","@id":"https:\/\/blog.scielo.org\/es\/author\/jeffpooley\/#author","url":"https:\/\/blog.scielo.org\/es\/author\/jeffpooley\/","name":"Jeff Pooley","image":{"@type":"ImageObject","@id":"https:\/\/blog.scielo.org\/es\/2024\/01\/19\/publicacion-en-llm\/#authorImage","url":"https:\/\/secure.gravatar.com\/avatar\/52fb94d443246a5208e26806f06d8d30daa072dec305387662ce6c71bd98272a?s=96&d=mm&r=g","width":96,"height":96,"caption":"Jeff Pooley"}},{"@type":"WebPage","@id":"https:\/\/blog.scielo.org\/es\/2024\/01\/19\/publicacion-en-llm\/#webpage","url":"https:\/\/blog.scielo.org\/es\/2024\/01\/19\/publicacion-en-llm\/","name":"Publicaci\u00f3n en Large Language Model (LLM) [Publicado originalmente en el blog Upstream en enero\/2024] | SciELO en Perspectiva","description":"El NYT dio la bienvenida al A\u00f1o Nuevo con una demanda contra OpenAI y Microsoft. OpenAI y su patrocinador Microsoft hab\u00edan robado, seg\u00fan el expediente, \u201cmillones de art\u00edculos de noticias protegidos por derechos de autor del Times, investigaciones en profundidad, art\u00edculos de opini\u00f3n, rese\u00f1as, gu\u00edas pr\u00e1cticas\u201d y m\u00e1s, todo para entrenar los LLMs de OpenAI.","inLanguage":"en-US","isPartOf":{"@id":"https:\/\/blog.scielo.org\/es\/#website"},"breadcrumb":{"@id":"https:\/\/blog.scielo.org\/es\/2024\/01\/19\/publicacion-en-llm\/#breadcrumblist"},"author":{"@id":"https:\/\/blog.scielo.org\/es\/author\/jeffpooley\/#author"},"creator":{"@id":"https:\/\/blog.scielo.org\/es\/author\/jeffpooley\/#author"},"image":{"@type":"ImageObject","url":"https:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2024\/01\/pexels-viktor-talashuk-2377295_thumb.jpg","@id":"https:\/\/blog.scielo.org\/es\/2024\/01\/19\/publicacion-en-llm\/#mainImage","width":150,"height":90,"caption":"Fotograf\u00eda superpuesta de varios libros con las p\u00e1ginas dobladas en forma de avi\u00f3n sobre un fondo negro infinito."},"primaryImageOfPage":{"@id":"https:\/\/blog.scielo.org\/es\/2024\/01\/19\/publicacion-en-llm\/#mainImage"},"datePublished":"2024-01-19T09:30:49-03:00","dateModified":"2024-01-19T09:32:41-03:00"},{"@type":"WebSite","@id":"https:\/\/blog.scielo.org\/es\/#website","url":"https:\/\/blog.scielo.org\/es\/","name":"SciELO en Perspectiva","inLanguage":"en-US","publisher":{"@id":"https:\/\/blog.scielo.org\/es\/#organization"}}]},"og:locale":"en_US","og:site_name":"SciELO en Perspectiva","og:type":"article","og:title":"Publicaci\u00f3n en Large Language Model (LLM) [Publicado originalmente en el blog Upstream en enero\/2024] | SciELO en Perspectiva","og:description":"El NYT dio la bienvenida al A\u00f1o Nuevo con una demanda contra OpenAI y Microsoft. OpenAI y su patrocinador Microsoft hab\u00edan robado, seg\u00fan el expediente, \u201cmillones de art\u00edculos de noticias protegidos por derechos de autor del Times, investigaciones en profundidad, art\u00edculos de opini\u00f3n, rese\u00f1as, gu\u00edas pr\u00e1cticas\u201d y m\u00e1s, todo para entrenar los LLMs de OpenAI.","og:url":"https:\/\/blog.scielo.org\/es\/2024\/01\/19\/publicacion-en-llm\/","fb:admins":"SciELONetwork","article:published_time":"2024-01-19T12:30:49+00:00","article:modified_time":"2024-01-19T12:32:41+00:00","article:publisher":"https:\/\/www.facebook.com\/SciELONetwork","twitter:card":"summary","twitter:site":"@RedeSciELO","twitter:title":"Publicaci\u00f3n en Large Language Model (LLM) [Publicado originalmente en el blog Upstream en enero\/2024] | SciELO en Perspectiva","twitter:description":"El NYT dio la bienvenida al A\u00f1o Nuevo con una demanda contra OpenAI y Microsoft. OpenAI y su patrocinador Microsoft hab\u00edan robado, seg\u00fan el expediente, \u201cmillones de art\u00edculos de noticias protegidos por derechos de autor del Times, investigaciones en profundidad, art\u00edculos de opini\u00f3n, rese\u00f1as, gu\u00edas pr\u00e1cticas\u201d y m\u00e1s, todo para entrenar los LLMs de OpenAI.","twitter:creator":"@RedeSciELO"},"aioseo_meta_data":{"post_id":"5475","title":null,"description":null,"keywords":[],"keyphrases":{"focus":{"keyphrase":"","score":0,"analysis":{"keyphraseInTitle":{"score":0,"maxScore":9,"error":1}}},"additional":[]},"primary_term":{"category":3},"canonical_url":null,"og_title":null,"og_description":null,"og_object_type":"default","og_image_type":"default","og_image_url":null,"og_image_width":null,"og_image_height":null,"og_image_custom_url":null,"og_image_custom_fields":null,"og_video":"","og_custom_url":null,"og_article_section":null,"og_article_tags":[],"twitter_use_og":false,"twitter_card":"default","twitter_image_type":"default","twitter_image_url":null,"twitter_image_custom_url":null,"twitter_image_custom_fields":null,"twitter_title":null,"twitter_description":null,"schema":{"blockGraphs":[],"customGraphs":[],"default":{"data":{"Article":[],"Course":[],"Dataset":[],"FAQPage":[],"Movie":[],"Person":[],"Product":[],"ProductReview":[],"Car":[],"Recipe":[],"Service":[],"SoftwareApplication":[],"WebPage":[]},"graphName":"Article","isEnabled":true},"graphs":[]},"schema_type":"default","schema_type_options":null,"pillar_content":false,"robots_default":true,"robots_noindex":false,"robots_noarchive":false,"robots_nosnippet":false,"robots_nofollow":false,"robots_noimageindex":false,"robots_noodp":false,"robots_notranslate":false,"robots_max_snippet":"-1","robots_max_videopreview":"-1","robots_max_imagepreview":"large","priority":null,"frequency":"default","local_seo":null,"seo_analyzer_scan_date":"2025-08-15 15:48:17","breadcrumb_settings":null,"limit_modified_date":false,"reviewed_by":null,"open_ai":"{\"title\":{\"suggestions\":[],\"usage\":0},\"description\":{\"suggestions\":[],\"usage\":0}}","ai":null,"created":"2024-01-18 17:05:57","updated":"2025-08-15 15:48:17"},"aioseo_breadcrumb":"<div class=\"aioseo-breadcrumbs\"><span class=\"aioseo-breadcrumb\">\n\t<a href=\"https:\/\/blog.scielo.org\/es\" title=\"Home\">Home<\/a>\n<\/span><span class=\"aioseo-breadcrumb-separator\">&raquo;<\/span><span class=\"aioseo-breadcrumb\">\n\t<a href=\"https:\/\/blog.scielo.org\/es\/category\/analisis\/\" title=\"An\u00e1lisis\">An\u00e1lisis<\/a>\n<\/span><span class=\"aioseo-breadcrumb-separator\">&raquo;<\/span><span class=\"aioseo-breadcrumb\">\n\tPublicaci\u00f3n en Large Language Model (LLM) [Publicado originalmente en el blog Upstream en enero\/2024]\n<\/span><\/div>","aioseo_breadcrumb_json":[{"label":"Home","link":"https:\/\/blog.scielo.org\/es"},{"label":"An\u00e1lisis","link":"https:\/\/blog.scielo.org\/es\/category\/analisis\/"},{"label":"Publicaci\u00f3n en Large Language Model (LLM) [Publicado originalmente en el blog Upstream en enero\/2024]","link":"https:\/\/blog.scielo.org\/es\/2024\/01\/19\/publicacion-en-llm\/"}],"_links":{"self":[{"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/posts\/5475","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/users\/99"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/comments?post=5475"}],"version-history":[{"count":4,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/posts\/5475\/revisions"}],"predecessor-version":[{"id":5481,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/posts\/5475\/revisions\/5481"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/media\/5476"}],"wp:attachment":[{"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/media?parent=5475"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/categories?post=5475"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/tags?post=5475"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}