{"id":5780,"date":"2025-07-18T13:45:44","date_gmt":"2025-07-18T16:45:44","guid":{"rendered":"https:\/\/blog.scielo.org\/es\/?p=5780"},"modified":"2025-09-24T11:41:30","modified_gmt":"2025-09-24T14:41:30","slug":"linguistica-para-una-inteligencia-artificial-ia-brasilena","status":"publish","type":"post","link":"https:\/\/blog.scielo.org\/es\/2025\/07\/18\/linguistica-para-una-inteligencia-artificial-ia-brasilena\/","title":{"rendered":"Ling\u00fc\u00edstica para una inteligencia artificial (IA) brasile\u00f1a"},"content":{"rendered":"<p><strong>Por Raquel Freitag<\/strong><\/p>\n<div id=\"attachment_5781\" style=\"width: 310px\" class=\"wp-caption alignright\"><a href=\"http:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2025\/07\/steve-johnson-_0iV9LmPDn0-unsplash.jpg\" target=\"_blank\" rel=\"noopener\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-5781\" class=\"wp-image-5781 size-medium\" title=\"Ilustraci\u00f3n digital que muestra una representaci\u00f3n de un cerebro formado por circuitos.\" src=\"http:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2025\/07\/steve-johnson-_0iV9LmPDn0-unsplash-300x169.jpg\" alt=\"Ilustraci\u00f3n digital que muestra una representaci\u00f3n de un cerebro formado por circuitos.\" width=\"300\" height=\"169\" srcset=\"https:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2025\/07\/steve-johnson-_0iV9LmPDn0-unsplash-300x169.jpg 300w, https:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2025\/07\/steve-johnson-_0iV9LmPDn0-unsplash-768x432.jpg 768w, https:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2025\/07\/steve-johnson-_0iV9LmPDn0-unsplash.jpg 1000w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" \/><\/a><p id=\"caption-attachment-5781\" class=\"wp-caption-text\"><em> Imagem: <a href=\"https:\/\/unsplash.com\/pt-br\/fotografias\/uma-placa-de-circuito-de-computador-com-um-cerebro-sobre-ele-_0iV9LmPDn0\" target=\"_blank\" rel=\"noopener\">Steve Johnson via Unsplash<\/a><\/em><\/p><\/div>\n<p>No hace mucho, las compa\u00f1\u00edas telef\u00f3nicas implementaron sistemas de contestador autom\u00e1tico, precursores del asistente virtual que domina la tecnolog\u00eda actual. Quer\u00eda resolver un problema sencillo: mi factura de internet ten\u00eda un importe incorrecto. Llam\u00e9 al n\u00famero de atenci\u00f3n al cliente, pero no hablaba con una persona.<\/p>\n<p>&#8220;Por favor, explique brevemente el motivo de su contacto&#8221;, dijo una voz amable pero artificial. &#8220;Factura equivocada,&#8221; respond\u00ed. &#8220;Entiendo: una segunda copia de la factura. \u00bfEs correcto?&#8221; &#8220;\u00a1No! \u00a1Se trata de un importe incorrecto!&#8221; &#8220;Lo siento, no entend\u00ed su solicitud. Intent\u00e9 de nuevo: d\u00edgame el motivo de su contacto&#8221;.<\/p>\n<p>Y as\u00ed durante un rato: &#8220;error de facturaci\u00f3n&#8221;, &#8220;importe incorrecto&#8221;, &#8220;factura equivocada&#8221;, aunque hablaba despacio, con enfado, con emoci\u00f3n, y la respuesta siempre era la misma: &#8220;Lo siento, no entend\u00ed&#8221;. Pens\u00e9 que era mejor pagar la factura de R$20.00 que seguir enfadado.<\/p>\n<p>Hoy en d\u00eda, a pesar de los avances tecnol\u00f3gicos disponibles, con todos los avances en inteligencia artificial generativa (IA Gen), lamentablemente, el resultado ser\u00eda muy similar si el modelo se implementara para atender a personas en el INSS (Instituto Nacional de Seguridad Social) o para transcribir teleconsultas para el SUS (Sistema \u00danico de Salud). Esto se debe a que las tecnolog\u00edas ling\u00fc\u00edsticas que sustentan estos sistemas a\u00fan dependen de modelos traducidos del ingl\u00e9s.<\/p>\n<p>Adem\u00e1s del trabajo de los desarrolladores, las contribuciones de los ling\u00fcistas \u2014 profesionales que trabajan no solo describiendo y teorizando sobre idiomas, sino tambi\u00e9n recopilando muestras ling\u00fc\u00edsticas de diferentes variedades de la lengua y perfiles humanos \u2014 pueden ayudar a entrenar la IA de forma m\u00e1s eficiente, con mayor equidad y justicia social, teniendo en cuenta la diversidad ling\u00fc\u00edstica brasile\u00f1a.<\/p>\n<p>Mientras que los humanos aprendemos las reglas gramaticales de un idioma a partir de nuestras experiencias, la inteligencia artificial generativa se basa en modelos ling\u00fc\u00edsticos a gran escala (y no ling\u00fc\u00edsticos), (del ingl\u00e9s <em>large language models<\/em>, conocidos por la sigla LLMs), que se entrenan con datos ling\u00fc\u00edsticos a partir de los cuales se identifican patrones estad\u00edsticos de ocurrencia de palabras en contexto.<\/p>\n<p>Alcanzar estos patrones requiere un gran volumen de datos ling\u00fc\u00edsticos, un volumen realmente enorme. Los LLM se entrenan con miles de millones de palabras y millones de par\u00e1metros para lograr una precisi\u00f3n tal que no deja lugar a dudas sobre si se trata de un humano o de una m\u00e1quina, superando as\u00ed la prueba de Turing.<\/p>\n<p>Actualmente, desconocemos con exactitud qu\u00e9 textos se seleccionan para el conjunto de datos de entrenamiento ni qu\u00e9 par\u00e1metros se controlan. Los desarrolladores no divulgan esta informaci\u00f3n porque el volumen de datos requerido supera con creces la disponibilidad en l\u00ednea de obras de dominio p\u00fablico.<\/p>\n<p>En la mayor\u00eda de los casos, los datos se recopilan sin consentimiento o infringen derechos de autor, lo que ha llevado a grandes conglomerados de medios a presentar demandas. Sin embargo, la fiabilidad de las respuestas que obtenemos refuerza la necesidad de un conjunto de datos de entrenamiento cada vez m\u00e1s amplio que abarque todas las dimensiones de la variabilidad del lenguaje humano.<\/p>\n<p>Las cuestiones \u00e9ticas y de derechos de autor no son las \u00fanicas limitaciones de este proceso. Los costos ambientales que implica el entrenamiento de modelos son muy elevados y podr\u00edan reducirse mediante la adopci\u00f3n de datos estructurados para el aprendizaje supervisado.<\/p>\n<p>El entrenamiento de modelos puede realizarse con datos estructurados (aprendizaje supervisado) y no estructurados (aprendizaje no supervisado). Mientras que el aprendizaje no supervisado requiere un gran volumen de datos, lo que exige costos computacionales cada vez mayores y genera impactos energ\u00e9ticos y ambientales, el aprendizaje supervisado, con datos estructurados y etiquetados, puede optimizar este proceso. Adem\u00e1s, el aprendizaje supervisado con datos estructurados y etiquetados, como el resultante de proyectos de documentaci\u00f3n ling\u00fc\u00edstica, puede resultar en menores demandas de procesamiento (y menores costos energ\u00e9ticos y ambientales) para obtener resultados m\u00e1s optimizados.<\/p>\n<p>Los modelos LLM pueden entrenarse con datos ling\u00fc\u00edsticos y, mediante el c\u00e1lculo de las probabilidades de coocurrencia de palabras, llegar a patrones e inferir reglas. Para llegar a estos patrones, se necesitan much\u00edsimas palabras.<\/p>\n<p>Por ejemplo, la palabra &#8220;<em>cobra<\/em>&#8221; puede ser un sustantivo, como en &#8220;La cobra mordi\u00f3 a Juan&#8221;, o un verbo, como en &#8220;Juan cobra por el servicio&#8221;. Para identificar si &#8220;cobra&#8221; es un verbo o un sustantivo, el modelo necesita una gran cantidad de contextos en los que esa palabra aparezca para llegar a una generalizaci\u00f3n. Esto es, en t\u00e9rminos generales, un entrenamiento no supervisado.<\/p>\n<p>Por otro lado, es posible entrenar modelos con datos categorizados: cada palabra tiene una etiqueta que explica alg\u00fan aspecto de su funcionamiento, de modo que el modelo se sigue f\u00e1cilmente. Cada elemento ling\u00fc\u00edstico recibe una etiqueta. En los ejemplos anteriores, una etiqueta morfol\u00f3gica ser\u00eda<\/p>\n<p style=\"padding-left: 40px;\">Una[DET] cobra [SUSTANTIVO] mordi\u00f3 a [VERBO] Juan[SUSTANTIVO]<\/p>\n<p style=\"padding-left: 40px;\">Juan[SUSTANTIVO] cobra[VERBO] el[DET] servicio[SUSTANTIVO]<\/p>\n<p>En el caso de la palabra \u201ccobra\u201d, la etiqueta del sustantivo o verbo se asigna mediante una regla morfosint\u00e1ctica, si tiene un elemento [DET] a la izquierda, es [SUBST]; si no, es [verbo].<\/p>\n<p>El etiquetado de datos ling\u00fc\u00edsticos sigue siendo un proceso que requiere recursos humanos especializados, lo que, en principio, resulta costoso en t\u00e9rminos de inversi\u00f3n. Sin embargo, en Brasil, un gran volumen de datos estructurados se pierde en memorias USB, discos duros y repositorios no sistem\u00e1ticos. Esta es la realidad de los productos derivados de la documentaci\u00f3n ling\u00fc\u00edstica y la investigaci\u00f3n descriptiva.<\/p>\n<p>La ling\u00fc\u00edstica es una de las disciplinas m\u00e1s extendidas en Brasil, con m\u00e1s de 100 programas de posgrado y numerosos proyectos de investigaci\u00f3n que dan lugar a recopilaciones de datos ling\u00fc\u00edsticos. Algunas de estas recopilaciones son m\u00e1s famosas, como el proyecto Norma Urbana Culta (NURC), establecido a finales de los a\u00f1os sesenta y setenta con muestras de habla de tres situaciones estil\u00edsticas diferentes en cinco capitales brasile\u00f1as, y que sienta las bases de las gram\u00e1ticas portuguesas contempor\u00e1neas.<\/p>\n<p>Los datos ling\u00fc\u00edsticos recopilados para el proyecto NURC han sustentado un vasto corpus de investigaci\u00f3n cient\u00edfica sobre el portugu\u00e9s brasile\u00f1o, contribuyendo no solo a la consolidaci\u00f3n de la ling\u00fc\u00edstica, sino tambi\u00e9n a la formaci\u00f3n de recursos humanos especializados.<\/p>\n<p>Otras colecciones de datos ling\u00fc\u00edsticos son m\u00e1s espec\u00edficas, m\u00e1s peque\u00f1as, pero no menos importantes: son aquellas que se crearon para una disertaci\u00f3n o tesis y luego quedaron \u201colvidadas\u201d en alg\u00fan repositorio.<\/p>\n<p>En un escenario donde los ling\u00fcistas tienen colecciones de datos ling\u00fc\u00edsticos anotados, con rigor cient\u00edfico, y los desarrolladores buscan cualquier tipo de dato ling\u00fc\u00edstico para entrenar sus modelos, una asociaci\u00f3n sin\u00e9rgica entre las \u00e1reas es la propuesta de la Plataforma Brasile\u00f1a de Diversidad Ling\u00fc\u00edstica, presentada a la convocatoria CNPq\/SECTICS\/CAPES\/FAPs n\u00ba 46\/2024 \u2013 Programa de los Institutos Nacionales de Ciencia y Tecnolog\u00eda \u2013 INCT (aprobado por m\u00e9rito, pero no financiado) y compartida en SciELO Preprints en <em><a href=\"https:\/\/doi.org\/10.1590\/SciELOPreprints.11957\">Plataforma da Diversidade Lingu\u00edstica Brasileira: Dados lingu\u00edsticos para uma IA brasileira<\/a><\/em>.<a id=\"nt1\" href=\"#rf1\"><sup>1<\/sup><\/a><\/p>\n<p>En Brasil, adem\u00e1s del portugu\u00e9s y sus variantes, existen m\u00e1s de 250 lenguas (ind\u00edgenas, inmigrantes y de se\u00f1as) que se descuidan en la inclusi\u00f3n digital debido a la falta de datos estructurados. Incluso el portugu\u00e9s se descuida, ya que la formaci\u00f3n de LLM con traducciones del ingl\u00e9s genera asimetr\u00edas y sesgos.<\/p>\n<p>El consorcio de laboratorios y grupos de investigaci\u00f3n que conformaron la Plataforma Brasile\u00f1a de Diversidad Ling\u00fc\u00edstica propuso trabajar en la preparaci\u00f3n de datos ling\u00fc\u00edsticos para la formaci\u00f3n de LLM, considerando la diversidad ling\u00fc\u00edstica brasile\u00f1a, mediante el desarrollo de un protocolo conjunto para la recopilaci\u00f3n de datos ling\u00fc\u00edsticos en el campo, que se replicar\u00e1 longitudinalmente entre grupos y laboratorios.<\/p>\n<p>Esta propuesta tambi\u00e9n busca estandarizar los procedimientos de transcripci\u00f3n, alineaci\u00f3n y etiquetado de datos ling\u00fc\u00edsticos para crear conjuntos de datos que representen la diversidad ling\u00fc\u00edstica brasile\u00f1a.<\/p>\n<p>La Plataforma Brasile\u00f1a de Diversidad Ling\u00fc\u00edstica responde directamente al objetivo del <a href=\"https:\/\/www.gov.br\/mcti\/pt-br\/centrais-de-conteudo\/publicacoes-mcti\/plano-brasileiro-de-inteligencia-artificial\/pbia_mcti_2025.pdf\">Plan Brasile\u00f1o de Inteligencia Artificial<\/a><a id=\"nt2\" href=\"#rf2\"><sup>2<\/sup><\/a> (<em>Plano Brasileiro de Intelig\u00eancia Artificial<\/em>, PBIA) de \u201cdesarrollar modelos ling\u00fc\u00edsticos a gran escala (LLM) para inteligencia artificial en portugu\u00e9s, basados en datos nacionales\u201d (PBIA, 2025, pp. 13).<\/p>\n<p>Recientemente publicada, la versi\u00f3n final del Plan Brasile\u00f1o de Inteligencia Artificial<a id=\"nt2\" href=\"#rf2\"><sup>2<\/sup><\/a> propone mejorar la calidad de vida de los brasile\u00f1os mediante innovaciones tecnol\u00f3gicas en \u00e1reas estrat\u00e9gicas como la salud, la agricultura, el medio ambiente y la educaci\u00f3n. En este contexto, la investigaci\u00f3n ling\u00fc\u00edstica desempe\u00f1a un papel estrat\u00e9gico. Los estudios socioling\u00fc\u00edsticos y de procesamiento del lenguaje natural contribuyen al desarrollo de tecnolog\u00edas m\u00e1s inclusivas capaces de abordar la diversidad ling\u00fc\u00edstica de Brasil y evitar sesgos en los modelos de IA.<\/p>\n<p>En concreto, la Acci\u00f3n 9 de PBIA propone una<\/p>\n<p style=\"padding-left: 40px;\">IA nacional basada en datos (LLM en portugu\u00e9s), que fomente la conservaci\u00f3n de conjuntos de datos nacionales y apoye el desarrollo de modelos fundamentales, en particular modelos ling\u00fc\u00edsticos a gran escala (LLM) especializados en portugu\u00e9s. (PBIA, 2025, pp. 70)<a id=\"nt2\" href=\"#rf2\"><sup>2<\/sup><\/a><\/p>\n<p>La propuesta de una Plataforma Brasile\u00f1a de Diversidad Ling\u00fc\u00edstica responde directamente al reto de PBIA de crear y mejorar bases de datos nacionales para el entrenamiento de modelos de IA, centr\u00e1ndose en reducir la dependencia de datos extranjeros y en reconocer las especificidades ling\u00fc\u00edsticas y culturales de Brasil, tal como se propone.<\/p>\n<p>La propuesta de curaci\u00f3n de la Plataforma Brasile\u00f1a de Diversidad Ling\u00fc\u00edstica, que re\u00fane datos estructurados y documentados de diferentes variedades del portugu\u00e9s brasile\u00f1o y otras lenguas brasile\u00f1as, est\u00e1 directamente alineada con los objetivos de la iniciativa de ampliar la disponibilidad de conjuntos de datos nacionales y facilitar el desarrollo de un LLM que tenga en cuenta la diversidad ling\u00fc\u00edstica real en Brasil.<\/p>\n<p>En lugar de replicar los est\u00e1ndares de traducci\u00f3n al ingl\u00e9s, los datos estructurados curados por la Plataforma Brasile\u00f1a de Diversidad Ling\u00fc\u00edstica permiten el desarrollo de LLM que reflejen la realidad ling\u00fc\u00edstica brasile\u00f1a, esencial para el \u00e9xito de las aplicaciones tecnol\u00f3gicas en las \u00e1reas de salud, educaci\u00f3n, justicia, inclusi\u00f3n digital y otros sectores estrat\u00e9gicos<\/p>\n<p>Los datos estructurados sobre la documentaci\u00f3n ling\u00fc\u00edstica oral de diferentes variedades del portugu\u00e9s brasile\u00f1o son esenciales para el \u00e9xito de la Acci\u00f3n de Impacto 1 de PBIA: el desarrollo de un sistema de IA para la transcripci\u00f3n autom\u00e1tica de teleconsultas en el SUS.<\/p>\n<p>Sin datos representativos de la diversidad ling\u00fc\u00edstica presente en Brasil, los modelos de transcripci\u00f3n no han alcanzado la precisi\u00f3n necesaria para el reconocimiento de voz, que es sensible a las diferencias regionales, de edad y sociales. Sin esta diversidad en los datos de entrenamiento, existe un alto riesgo de que el sistema desarrollado sea inexacto o excluyente, especialmente en regiones donde el portugu\u00e9s hablado se desv\u00eda de la norma hegem\u00f3nica.<\/p>\n<p>Para el desarrollo de un \u201csistema de IA para automatizar la transcripci\u00f3n de teleconsultas\u201d<a id=\"nt2\" href=\"#rf2\"><sup>2<\/sup><\/a>\u00a0(PBIA, pp. 47), la documentaci\u00f3n ling\u00fc\u00edstica con anotaci\u00f3n estructurada, que incluye la marcaci\u00f3n de pausas, entonaci\u00f3n, vacilaciones y solapamiento de habla, puede mejorar la precisi\u00f3n de los modelos en contextos reales de teleconsulta, que implican lenguaje espont\u00e1neo y, a menudo, condiciones ac\u00fasticas desfavorables, con ruido y solapamiento de habla.<\/p>\n<p>No debemos olvidar que Libras es un idioma reconocido y, por ley, el uso de la lengua de se\u00f1as es obligatorio en los servicios p\u00fablicos. Los sistemas de IA tambi\u00e9n deben considerar las lenguas de se\u00f1as en Brasil (y Libras es solo una de ellas), lo que requiere datos de documentaci\u00f3n ling\u00fc\u00edstica estructurada tambi\u00e9n en lenguas de se\u00f1as.<\/p>\n<p>Adem\u00e1s de los sistemas de IA para la transcripci\u00f3n y se\u00f1alizaci\u00f3n del habla, la implementaci\u00f3n de la Acci\u00f3n de Impacto 7 de PBIA, cuyo objetivo es crear una plataforma de IA para promover la salud de los adultos mayores, requiere datos estructurados sobre este perfil de edad, considerando no solo las diferencias regionales y socioecon\u00f3micas, sino tambi\u00e9n los efectos de las dificultades cognitivas derivadas del envejecimiento.<\/p>\n<p>Los modelos ling\u00fc\u00edsticos entrenados en base de un conjunto de datos de este perfil ling\u00fc\u00edstico son esenciales para una comunicaci\u00f3n m\u00e1s emp\u00e1tica, clara y precisa entre los adultos mayores y los sistemas de salud automatizados.<\/p>\n<p>Yendo a\u00fan m\u00e1s lejos, los datos ling\u00fc\u00edsticos estructurados pueden respaldar el desarrollo de herramientas de detecci\u00f3n temprana de enfermedades neurodegenerativas al identificar patrones ling\u00fc\u00edsticos asociados con los s\u00edntomas tempranos del Alzheimer, el Parkinson y otras demencias, como el empobrecimiento l\u00e9xico, las vacilaciones y los cambios en la fluidez y la coherencia del habla.<\/p>\n<p>Como podemos observar, la diversidad de datos ling\u00fc\u00edsticos es esencial para que los LLM garanticen la justicia social y la equidad, con representaci\u00f3n de lenguas de diferentes regiones y grupos sociales.<\/p>\n<p>La Plataforma Brasile\u00f1a de Diversidad Ling\u00fc\u00edstica es una propuesta para reunir a expertos en datos estructurados de lenguas brasile\u00f1as, en diferentes situaciones y contextos de uso, y a desarrolladores de aplicaciones basadas en LLM.<\/p>\n<p>Dada la demanda de PBIA, decidimos compartir la propuesta presentada a la convocatoria CNPq\/SECTICS\/CAPES\/FAPs n.\u00ba 46\/2024 \u2013 Programa de Institutos Nacionales de Ciencia y Tecnolog\u00eda \u2013 INCT, junto con las opiniones recibidas, con el fin de fomentar y contribuir al perfeccionamiento de otras propuestas, y demostrar que, como ling\u00fcistas, tenemos algo que aportar al Plan Brasile\u00f1o de Inteligencia Artificial y contribuir a la mejora de la calidad de vida de los brasile\u00f1os.<\/p>\n<h3>Notas<\/h3>\n<p>1. FREITAG, R.M.K. Plataforma da Diversidade Lingu\u00edstica Brasileira: Dados lingu\u00edsticos para uma IA brasileira. <em>SciELO Preprints<\/em> [online]. 2025. [viewed 18 July 2025]. <a href=\"https:\/\/doi.org\/10.1590\/SciELOPreprints.11957\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.1590\/SciELOPreprints.11957<\/a>. Available from: <a href=\"https:\/\/preprints.scielo.org\/index.php\/scielo\/preprint\/view\/11957\/version\/12598\" target=\"_blank\" rel=\"noopener\">https:\/\/preprints.scielo.org\/index.php\/scielo\/preprint\/view\/11957\/version\/12598<\/a> <a id=\"rf1\" href=\"#nt1\">\u21a9<\/a><\/p>\n<p>2. Plano Brasileiro de Intelig\u00eancia Artificial (PBIA) [online]. MCTI \u2014 Minist\u00e9rio da Ci\u00eancia, Tecnologia e Inova\u00e7\u00e3o. 2025 [viewed 18 July 2025]. Available from: <a href=\"https:\/\/www.gov.br\/mcti\/pt-br\/centrais-de-conteudo\/publicacoes-mcti\/plano-brasileiro-de-inteligencia-artificial\/pbia_mcti_2025.pdf\" target=\"_blank\" rel=\"noopener\">https:\/\/www.gov.br\/mcti\/pt-br\/centrais-de-conteudo\/publicacoes-mcti\/plano-brasileiro-de-inteligencia-artificial\/pbia_mcti_2025.pdf<\/a> <a id=\"rf2\" href=\"#nt2\">\u21a9<\/a><\/p>\n<h3>Referencias<\/h3>\n<p>BENDER, E., <em>et al<\/em>. On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? In: FAccT \u201921: 2021 ACM Conference on Fairness, Accountability, and Transparency, Virtual Event, 2021 [viewed 18 July 2025]. <a href=\"https:\/\/doi.org\/10.1145\/3442188.3445922\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.1145\/3442188.3445922<\/a>. Available from: <a href=\"https:\/\/dl.acm.org\/doi\/10.1145\/3442188.3445922\" target=\"_blank\" rel=\"noopener\">https:\/\/dl.acm.org\/doi\/10.1145\/3442188.3445922<\/a><\/p>\n<p>CASTILHO, A.T. Gram\u00e1tica do Portugu\u00eas Brasileiro: fundamentos, perspectivas. <em>Cadernos de Lingu\u00edstica<\/em> [online]. 2021, vol. 2, no. 1, e252\u2013e252, ISSN: 2675-4916 [viewed 18 July 2025]. <a href=\"https:\/\/doi.org\/10.25189\/2675-4916.2021.v2.n1.id252\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.25189\/2675-4916.2021.v2.n1.id252<\/a>. Available from: <a href=\"https:\/\/cadernos.abralin.org\/index.php\/cadernos\/article\/view\/252\" target=\"_blank\" rel=\"noopener\">https:\/\/cadernos.abralin.org\/index.php\/cadernos\/article\/view\/252<\/a><\/p>\n<p>FERRO, M. <em>et al<\/em>. Towards a sustainable artificial intelligence: A case study of energy efficiency in decision tree algorithms. <em>Concurrency and Computation: Practice and Experience<\/em> [online]. 2021, vol. 33, e6815, ISSN: 1532-0634 [viewed 18 July 2025]. <a href=\"https:\/\/doi.org\/10.1002\/cpe.6815\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.1002\/cpe.6815<\/a>. Available from: <a href=\"https:\/\/onlinelibrary.wiley.com\/doi\/10.1002\/cpe.6815\" target=\"_blank\" rel=\"noopener\">https:\/\/onlinelibrary.wiley.com\/doi\/10.1002\/cpe.6815<\/a><\/p>\n<p>FREITAG, R. Varia\u00e7\u00e3o lingu\u00edstica: Diversidade e cotidiano. S\u00e3o Paulo: Contexto, 2025.<\/p>\n<p>FREITAG, R., <em>et al<\/em>. Fun\u00e7\u00e3o na l\u00edngua, generaliza\u00e7\u00e3o e reprodutibilidade. <em>Revista da ABRALIN<\/em> [online]. 2021, vol. 20, no. 1, pp. 1\u201327, ISSN: 0102-7158 [viewed 18 July 2025]. <a href=\"https:\/\/doi.org\/10.25189\/rabralin.v20i1.1827\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.25189\/rabralin.v20i1.1827<\/a>. Available from: <a href=\"https:\/\/revista.abralin.org\/index.php\/abralin\/article\/view\/1827\" target=\"_blank\" rel=\"noopener\">https:\/\/revista.abralin.org\/index.php\/abralin\/article\/view\/1827<\/a><\/p>\n<p>FREITAG, R.M.K. Plataforma da Diversidade Lingu\u00edstica Brasileira: Dados lingu\u00edsticos para uma IA brasileira. <em>SciELO Preprints<\/em> [online]. 2025. [viewed 18 July 2025]. <a href=\"https:\/\/doi.org\/10.1590\/SciELOPreprints.11957\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.1590\/SciELOPreprints.11957<\/a>. Available from: <a href=\"https:\/\/preprints.scielo.org\/index.php\/scielo\/preprint\/view\/11957\/version\/12598\" target=\"_blank\" rel=\"noopener\">https:\/\/preprints.scielo.org\/index.php\/scielo\/preprint\/view\/11957\/version\/12598<\/a><\/p>\n<p>FREITAG, R.M.K. Preconceito lingu\u00edstico para humanizar as m\u00e1quinas. <em>Cadernos de Lingu\u00edstica<\/em> [online]. 2021, vol. 2, no. 4, e495, ISSN: 2675-4916 [viewed 18 July 2025]. <a href=\"https:\/\/doi.org\/10.25189\/2675-4916.2021.v2.n4.id495\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.25189\/2675-4916.2021.v2.n4.id495<\/a>. Available from: <a href=\"https:\/\/cadernos.abralin.org\/index.php\/cadernos\/article\/view\/495\" target=\"_blank\" rel=\"noopener\">https:\/\/cadernos.abralin.org\/index.php\/cadernos\/article\/view\/495<\/a><\/p>\n<p>GALDINO, J.C. and OLIVEIRA JR, M. Pros\u00f3dia e s\u00edntese da fala: uma revis\u00e3o integrativa da literatura. <em>Revista da ABRALIN<\/em> [online]. 2023, vol.\u202f22, no.\u202f1, pp.\u202f1\u201315 [viewed 18 July 2025]. <a href=\"https:\/\/doi.org\/10.25189\/rabralin.v22i1.2130\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.25189\/rabralin.v22i1.2130<\/a>. Available from: <a href=\"https:\/\/revista.abralin.org\/index.php\/abralin\/article\/view\/2130\" target=\"_blank\" rel=\"noopener\">https:\/\/revista.abralin.org\/index.php\/abralin\/article\/view\/2130<\/a><\/p>\n<p>H\u00dcBNER, L.C., <em>et al<\/em>. Nomea\u00e7\u00e3o e aprendizagem verbal na doen\u00e7a de Alzheimer, no comprometimento cognitivo leve e no envelhecimento sadio com baixa escolaridade. <em>Arquivos de Neuro-Psiquiatria<\/em> [online]. 2018, vol. 76, pp. 93\u201399, ISSN: 0004-282X [viewed 18 July 2025]. <a href=\"https:\/\/doi.org\/10.1590\/0004-282X2017019\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.1590\/0004-282X2017019<\/a>. Available from: <a href=\"https:\/\/www.scielo.br\/j\/anp\/a\/F6Kf9M7WVBsnpcFMKQXYcnC\/\" target=\"_blank\" rel=\"noopener\">https:\/\/www.scielo.br\/j\/anp\/a\/F6Kf9M7WVBsnpcFMKQXYcnC\/<\/a><\/p>\n<p>OLIVEIRA JR., M. NURC Digital: Um protocolo para a digitaliza\u00e7\u00e3o, anota\u00e7\u00e3o, arquivamento e dissemina\u00e7\u00e3o do material do Projeto da Norma Urbana Lingu\u00edstica Culta (NURC). <em>Chimera: Revista de Corpus de Lenguas Romances y Estudios Ling\u00fc\u00edsticos<\/em> [online]. 2016, vol. 3, no. 2, pp. 149\u2013174, ISSN e: 2386 2629 [viewed 18 July 2025]. <a href=\"https:\/\/doi.org\/10.15366\/chimera2016.3.2.004\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.15366\/chimera2016.3.2.004<\/a>. Available from: <a href=\"https:\/\/revistas.uam.es\/chimera\/article\/view\/6519\" target=\"_blank\" rel=\"noopener\">https:\/\/revistas.uam.es\/chimera\/article\/view\/6519<\/a><\/p>\n<p>Plano Brasileiro de Intelig\u00eancia Artificial (PBIA) [online]. MCTI \u2014 Minist\u00e9rio da Ci\u00eancia, Tecnologia e Inova\u00e7\u00e3o. 2025 [viewed 18 July 2025]. Available from: <a href=\"https:\/\/www.gov.br\/mcti\/pt-br\/centrais-de-conteudo\/publicacoes-mcti\/plano-brasileiro-de-inteligencia-artificial\/pbia_mcti_2025.pdf\" target=\"_blank\" rel=\"noopener\">https:\/\/www.gov.br\/mcti\/pt-br\/centrais-de-conteudo\/publicacoes-mcti\/plano-brasileiro-de-inteligencia-artificial\/pbia_mcti_2025.pdf<\/a><\/p>\n<p>QUADROS, R.M., <em>et al<\/em>. Invent\u00e1rio Nacional de Libras. <em>F\u00f3rum Lingu\u00edstico<\/em> [online]. 2020, vol. 17, no. 4, pp. 5457\u20135474, ISSN: 1984-8412 [viewed 18 July 2025]. <a href=\"https:\/\/doi.org\/10.5007\/1984-8412.2020.e77334\" target=\"_blank\" rel=\"noopener\">https:\/\/doi.org\/10.5007\/1984-8412.2020.e77334<\/a>. Available from: <a href=\"https:\/\/periodicos.ufsc.br\/index.php\/forum\/article\/view\/77334\" target=\"_blank\" rel=\"noopener\">https:\/\/periodicos.ufsc.br\/index.php\/forum\/article\/view\/77334<\/a><\/p>\n<p>TORRENT, T. Plano brasileiro para turbinar IA ignora conceito b\u00e1sico da tecnologia. Tilt [online]. 2025 [viewed 18 July 2025]. Available from: <a href=\"https:\/\/www.uol.com.br\/tilt\/analises\/ultimas-noticias\/2025\/06\/23\/plano-brasileiro-para-turbinar-ia-ignora-conceito-basico-da-tecnologia.htm\" target=\"_blank\" rel=\"noopener\">https:\/\/www.uol.com.br\/tilt\/analises\/ultimas-noticias\/2025\/06\/23\/plano-brasileiro-para-turbinar-ia-ignora-conceito-basico-da-tecnologia.htm<\/a><\/p>\n<p>&nbsp;<\/p>\n<h3>Sobre Raquel Freitag<\/h3>\n<div id=\"attachment_5782\" style=\"width: 160px\" class=\"wp-caption alignright\"><a href=\"http:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2025\/07\/Imagem3.jpg\" target=\"_blank\" rel=\"noopener\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-5782\" class=\"wp-image-5782 size-full\" title=\"Fotograf\u00eda de Raquel Freitag\" src=\"http:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2025\/07\/Imagem3.jpg\" alt=\"Fotograf\u00eda de Raquel Freitag\" width=\"150\" height=\"150\" \/><\/a><p id=\"caption-attachment-5782\" class=\"wp-caption-text\">#image_title<\/p><\/div>\n<p>Raquel Freitag es ling\u00fcista y profesora titular de la Universidad Federal de Sergipe, donde trabaja en los Programas de Posgrado en Lenguas y Psicolog\u00eda. Es doctora en Ling\u00fc\u00edstica por la Universidad Federal de Santa Catarina e investiga la variaci\u00f3n ling\u00fc\u00edstica, el procesamiento ling\u00fc\u00edstico y la reproducibilidad en la ciencia. Es coordinadora del Grupo de Trabajo de Socioling\u00fc\u00edstica de la ANPOLL (2023-2025). Es autora de <em>Varia\u00e7\u00e3o lingu\u00edstica: Diversidade e cotidiano<\/em>, publicado por Contexto (2025).<\/p>\n<p>&nbsp;<\/p>\n<p>Traducido del original en\u00a0<a href=\"https:\/\/blog.scielo.org\/blog\/2025\/07\/18\/linguistica-para-uma-inteligencia-artificial-ia-brasileira\/\" target=\"_blank\" rel=\"noopener\">ingl\u00e9s<\/a>\u00a0por Ernesto Spinak.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>La Plataforma Brasile\u00f1a de Diversidad Ling\u00fc\u00edstica es una propuesta de curaci\u00f3n de datos para entrenar modelos de IA con datos estructurados del portugu\u00e9s y de otras 250 lenguas brasile\u00f1as, en apoyo directo al Plan Brasile\u00f1o de Inteligencia Artificial. La iniciativa busca reducir los costos ambientales, evitar sesgos y crear tecnolog\u00edas m\u00e1s inclusivas para la salud, la educaci\u00f3n y los servicios p\u00fablicos. <span class=\"ellipsis\">&hellip;<\/span> <span class=\"more-link-wrap\"><a href=\"https:\/\/blog.scielo.org\/es\/2025\/07\/18\/linguistica-para-una-inteligencia-artificial-ia-brasilena\/\" class=\"more-link\"><span>Read More &rarr;<\/span><\/a><\/span><\/p>\n","protected":false},"author":130,"featured_media":5781,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"om_disable_all_campaigns":false,"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"footnotes":"","_links_to":"","_links_to_target":""},"categories":[3],"tags":[78,41],"class_list":["post-5780","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-analisis","tag-inteligencia-artificial","tag-politicas-publicas"],"aioseo_notices":[],"aioseo_head":"\n\t\t<!-- All in One SEO Pro 4.9.9 - aioseo.com -->\n\t<meta name=\"description\" content=\"La Plataforma Brasile\u00f1a de Diversidad Ling\u00fc\u00edstica es una propuesta de curaci\u00f3n de datos para entrenar modelos de IA con datos estructurados del portugu\u00e9s y de otras 250 lenguas brasile\u00f1as, en apoyo directo al Plan Brasile\u00f1o de Inteligencia Artificial. La iniciativa busca reducir los costos ambientales, evitar sesgos y crear tecnolog\u00edas m\u00e1s inclusivas para la salud, la educaci\u00f3n y los servicios p\u00fablicos.\" \/>\n\t<meta name=\"robots\" content=\"max-image-preview:large\" \/>\n\t<meta name=\"author\" content=\"Raquel Freitag\"\/>\n\t<meta name=\"keywords\" content=\"inteligencia artificial,pol\u00edticas p\u00fablicas,an\u00e1lisis\" \/>\n\t<link rel=\"canonical\" href=\"https:\/\/blog.scielo.org\/es\/2025\/07\/18\/linguistica-para-una-inteligencia-artificial-ia-brasilena\/\" \/>\n\t<meta name=\"generator\" content=\"All in One SEO Pro (AIOSEO) 4.9.9\" \/>\n\t\t<meta property=\"og:locale\" content=\"en_US\" \/>\n\t\t<meta property=\"og:site_name\" content=\"SciELO en Perspectiva\" \/>\n\t\t<meta property=\"og:type\" content=\"article\" \/>\n\t\t<meta property=\"og:title\" content=\"Ling\u00fc\u00edstica para una inteligencia artificial (IA) brasile\u00f1a | SciELO en Perspectiva\" \/>\n\t\t<meta property=\"og:description\" content=\"La Plataforma Brasile\u00f1a de Diversidad Ling\u00fc\u00edstica es una propuesta de curaci\u00f3n de datos para entrenar modelos de IA con datos estructurados del portugu\u00e9s y de otras 250 lenguas brasile\u00f1as, en apoyo directo al Plan Brasile\u00f1o de Inteligencia Artificial. La iniciativa busca reducir los costos ambientales, evitar sesgos y crear tecnolog\u00edas m\u00e1s inclusivas para la salud, la educaci\u00f3n y los servicios p\u00fablicos.\" \/>\n\t\t<meta property=\"og:url\" content=\"https:\/\/blog.scielo.org\/es\/2025\/07\/18\/linguistica-para-una-inteligencia-artificial-ia-brasilena\/\" \/>\n\t\t<meta property=\"fb:admins\" content=\"SciELONetwork\" \/>\n\t\t<meta property=\"article:published_time\" content=\"2025-07-18T16:45:44+00:00\" \/>\n\t\t<meta property=\"article:modified_time\" content=\"2025-09-24T14:41:30+00:00\" \/>\n\t\t<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/SciELONetwork\" \/>\n\t\t<meta name=\"twitter:card\" content=\"summary\" \/>\n\t\t<meta name=\"twitter:site\" content=\"@RedeSciELO\" \/>\n\t\t<meta name=\"twitter:title\" content=\"Ling\u00fc\u00edstica para una inteligencia artificial (IA) brasile\u00f1a | SciELO en Perspectiva\" \/>\n\t\t<meta name=\"twitter:description\" content=\"La Plataforma Brasile\u00f1a de Diversidad Ling\u00fc\u00edstica es una propuesta de curaci\u00f3n de datos para entrenar modelos de IA con datos estructurados del portugu\u00e9s y de otras 250 lenguas brasile\u00f1as, en apoyo directo al Plan Brasile\u00f1o de Inteligencia Artificial. La iniciativa busca reducir los costos ambientales, evitar sesgos y crear tecnolog\u00edas m\u00e1s inclusivas para la salud, la educaci\u00f3n y los servicios p\u00fablicos.\" \/>\n\t\t<meta name=\"twitter:creator\" content=\"@RedeSciELO\" \/>\n\t\t<script type=\"application\/ld+json\" class=\"aioseo-schema\">\n\t\t\t{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2025\\\/07\\\/18\\\/linguistica-para-una-inteligencia-artificial-ia-brasilena\\\/#article\",\"name\":\"Ling\\u00fc\\u00edstica para una inteligencia artificial (IA) brasile\\u00f1a | SciELO en Perspectiva\",\"headline\":\"Ling\\u00fc\\u00edstica para una inteligencia artificial (IA) brasile\\u00f1a\",\"author\":{\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/author\\\/raquelfreitag\\\/#author\"},\"publisher\":{\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/#organization\"},\"image\":{\"@type\":\"ImageObject\",\"url\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/wp-content\\\/uploads\\\/sites\\\/3\\\/2025\\\/07\\\/steve-johnson-_0iV9LmPDn0-unsplash.jpg\",\"width\":1000,\"height\":563,\"caption\":\"Imagem: Steve Johnson via Unsplash\"},\"datePublished\":\"2025-07-18T13:45:44-03:00\",\"dateModified\":\"2025-09-24T11:41:30-03:00\",\"inLanguage\":\"en-US\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2025\\\/07\\\/18\\\/linguistica-para-una-inteligencia-artificial-ia-brasilena\\\/#webpage\"},\"isPartOf\":{\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2025\\\/07\\\/18\\\/linguistica-para-una-inteligencia-artificial-ia-brasilena\\\/#webpage\"},\"articleSection\":\"An\\u00e1lisis, Inteligencia Artificial, Pol\\u00edticas P\\u00fablicas\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2025\\\/07\\\/18\\\/linguistica-para-una-inteligencia-artificial-ia-brasilena\\\/#breadcrumblist\",\"itemListElement\":[{\"@type\":\"ListItem\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es#listItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/blog.scielo.org\\\/es\",\"nextItem\":{\"@type\":\"ListItem\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/category\\\/analisis\\\/#listItem\",\"name\":\"An\\u00e1lisis\"}},{\"@type\":\"ListItem\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/category\\\/analisis\\\/#listItem\",\"position\":2,\"name\":\"An\\u00e1lisis\",\"item\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/category\\\/analisis\\\/\",\"nextItem\":{\"@type\":\"ListItem\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2025\\\/07\\\/18\\\/linguistica-para-una-inteligencia-artificial-ia-brasilena\\\/#listItem\",\"name\":\"Ling\\u00fc\\u00edstica para una inteligencia artificial (IA) brasile\\u00f1a\"},\"previousItem\":{\"@type\":\"ListItem\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es#listItem\",\"name\":\"Home\"}},{\"@type\":\"ListItem\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2025\\\/07\\\/18\\\/linguistica-para-una-inteligencia-artificial-ia-brasilena\\\/#listItem\",\"position\":3,\"name\":\"Ling\\u00fc\\u00edstica para una inteligencia artificial (IA) brasile\\u00f1a\",\"previousItem\":{\"@type\":\"ListItem\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/category\\\/analisis\\\/#listItem\",\"name\":\"An\\u00e1lisis\"}}]},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/#organization\",\"name\":\"SciELO en Perspectiva\",\"url\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/\",\"sameAs\":[\"https:\\\/\\\/www.facebook.com\\\/SciELONetwork\",\"https:\\\/\\\/twitter.com\\\/RedeSciELO\"]},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/author\\\/raquelfreitag\\\/#author\",\"url\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/author\\\/raquelfreitag\\\/\",\"name\":\"Raquel Freitag\",\"image\":{\"@type\":\"ImageObject\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2025\\\/07\\\/18\\\/linguistica-para-una-inteligencia-artificial-ia-brasilena\\\/#authorImage\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/b00247ad1f8c4f59712ce072e2ea41d7ab02ae5a72eba70194308256eab78051?s=96&d=mm&r=g\",\"width\":96,\"height\":96,\"caption\":\"Raquel Freitag\"}},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2025\\\/07\\\/18\\\/linguistica-para-una-inteligencia-artificial-ia-brasilena\\\/#webpage\",\"url\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2025\\\/07\\\/18\\\/linguistica-para-una-inteligencia-artificial-ia-brasilena\\\/\",\"name\":\"Ling\\u00fc\\u00edstica para una inteligencia artificial (IA) brasile\\u00f1a | SciELO en Perspectiva\",\"description\":\"La Plataforma Brasile\\u00f1a de Diversidad Ling\\u00fc\\u00edstica es una propuesta de curaci\\u00f3n de datos para entrenar modelos de IA con datos estructurados del portugu\\u00e9s y de otras 250 lenguas brasile\\u00f1as, en apoyo directo al Plan Brasile\\u00f1o de Inteligencia Artificial. La iniciativa busca reducir los costos ambientales, evitar sesgos y crear tecnolog\\u00edas m\\u00e1s inclusivas para la salud, la educaci\\u00f3n y los servicios p\\u00fablicos.\",\"inLanguage\":\"en-US\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/#website\"},\"breadcrumb\":{\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2025\\\/07\\\/18\\\/linguistica-para-una-inteligencia-artificial-ia-brasilena\\\/#breadcrumblist\"},\"author\":{\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/author\\\/raquelfreitag\\\/#author\"},\"creator\":{\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/author\\\/raquelfreitag\\\/#author\"},\"image\":{\"@type\":\"ImageObject\",\"url\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/wp-content\\\/uploads\\\/sites\\\/3\\\/2025\\\/07\\\/steve-johnson-_0iV9LmPDn0-unsplash.jpg\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2025\\\/07\\\/18\\\/linguistica-para-una-inteligencia-artificial-ia-brasilena\\\/#mainImage\",\"width\":1000,\"height\":563,\"caption\":\"Imagem: Steve Johnson via Unsplash\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/2025\\\/07\\\/18\\\/linguistica-para-una-inteligencia-artificial-ia-brasilena\\\/#mainImage\"},\"datePublished\":\"2025-07-18T13:45:44-03:00\",\"dateModified\":\"2025-09-24T11:41:30-03:00\"},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/#website\",\"url\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/\",\"name\":\"SciELO en Perspectiva\",\"inLanguage\":\"en-US\",\"publisher\":{\"@id\":\"https:\\\/\\\/blog.scielo.org\\\/es\\\/#organization\"}}]}\n\t\t<\/script>\n\t\t<!-- All in One SEO Pro -->\r\n\t\t<title>Ling\u00fc\u00edstica para una inteligencia artificial (IA) brasile\u00f1a | SciELO en Perspectiva<\/title>\n\n","aioseo_head_json":{"title":"Ling\u00fc\u00edstica para una inteligencia artificial (IA) brasile\u00f1a | SciELO en Perspectiva","description":"La Plataforma Brasile\u00f1a de Diversidad Ling\u00fc\u00edstica es una propuesta de curaci\u00f3n de datos para entrenar modelos de IA con datos estructurados del portugu\u00e9s y de otras 250 lenguas brasile\u00f1as, en apoyo directo al Plan Brasile\u00f1o de Inteligencia Artificial. La iniciativa busca reducir los costos ambientales, evitar sesgos y crear tecnolog\u00edas m\u00e1s inclusivas para la salud, la educaci\u00f3n y los servicios p\u00fablicos.","canonical_url":"https:\/\/blog.scielo.org\/es\/2025\/07\/18\/linguistica-para-una-inteligencia-artificial-ia-brasilena\/","robots":"max-image-preview:large","keywords":"inteligencia artificial,pol\u00edticas p\u00fablicas,an\u00e1lisis","webmasterTools":{"miscellaneous":""},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/blog.scielo.org\/es\/2025\/07\/18\/linguistica-para-una-inteligencia-artificial-ia-brasilena\/#article","name":"Ling\u00fc\u00edstica para una inteligencia artificial (IA) brasile\u00f1a | SciELO en Perspectiva","headline":"Ling\u00fc\u00edstica para una inteligencia artificial (IA) brasile\u00f1a","author":{"@id":"https:\/\/blog.scielo.org\/es\/author\/raquelfreitag\/#author"},"publisher":{"@id":"https:\/\/blog.scielo.org\/es\/#organization"},"image":{"@type":"ImageObject","url":"https:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2025\/07\/steve-johnson-_0iV9LmPDn0-unsplash.jpg","width":1000,"height":563,"caption":"Imagem: Steve Johnson via Unsplash"},"datePublished":"2025-07-18T13:45:44-03:00","dateModified":"2025-09-24T11:41:30-03:00","inLanguage":"en-US","mainEntityOfPage":{"@id":"https:\/\/blog.scielo.org\/es\/2025\/07\/18\/linguistica-para-una-inteligencia-artificial-ia-brasilena\/#webpage"},"isPartOf":{"@id":"https:\/\/blog.scielo.org\/es\/2025\/07\/18\/linguistica-para-una-inteligencia-artificial-ia-brasilena\/#webpage"},"articleSection":"An\u00e1lisis, Inteligencia Artificial, Pol\u00edticas P\u00fablicas"},{"@type":"BreadcrumbList","@id":"https:\/\/blog.scielo.org\/es\/2025\/07\/18\/linguistica-para-una-inteligencia-artificial-ia-brasilena\/#breadcrumblist","itemListElement":[{"@type":"ListItem","@id":"https:\/\/blog.scielo.org\/es#listItem","position":1,"name":"Home","item":"https:\/\/blog.scielo.org\/es","nextItem":{"@type":"ListItem","@id":"https:\/\/blog.scielo.org\/es\/category\/analisis\/#listItem","name":"An\u00e1lisis"}},{"@type":"ListItem","@id":"https:\/\/blog.scielo.org\/es\/category\/analisis\/#listItem","position":2,"name":"An\u00e1lisis","item":"https:\/\/blog.scielo.org\/es\/category\/analisis\/","nextItem":{"@type":"ListItem","@id":"https:\/\/blog.scielo.org\/es\/2025\/07\/18\/linguistica-para-una-inteligencia-artificial-ia-brasilena\/#listItem","name":"Ling\u00fc\u00edstica para una inteligencia artificial (IA) brasile\u00f1a"},"previousItem":{"@type":"ListItem","@id":"https:\/\/blog.scielo.org\/es#listItem","name":"Home"}},{"@type":"ListItem","@id":"https:\/\/blog.scielo.org\/es\/2025\/07\/18\/linguistica-para-una-inteligencia-artificial-ia-brasilena\/#listItem","position":3,"name":"Ling\u00fc\u00edstica para una inteligencia artificial (IA) brasile\u00f1a","previousItem":{"@type":"ListItem","@id":"https:\/\/blog.scielo.org\/es\/category\/analisis\/#listItem","name":"An\u00e1lisis"}}]},{"@type":"Organization","@id":"https:\/\/blog.scielo.org\/es\/#organization","name":"SciELO en Perspectiva","url":"https:\/\/blog.scielo.org\/es\/","sameAs":["https:\/\/www.facebook.com\/SciELONetwork","https:\/\/twitter.com\/RedeSciELO"]},{"@type":"Person","@id":"https:\/\/blog.scielo.org\/es\/author\/raquelfreitag\/#author","url":"https:\/\/blog.scielo.org\/es\/author\/raquelfreitag\/","name":"Raquel Freitag","image":{"@type":"ImageObject","@id":"https:\/\/blog.scielo.org\/es\/2025\/07\/18\/linguistica-para-una-inteligencia-artificial-ia-brasilena\/#authorImage","url":"https:\/\/secure.gravatar.com\/avatar\/b00247ad1f8c4f59712ce072e2ea41d7ab02ae5a72eba70194308256eab78051?s=96&d=mm&r=g","width":96,"height":96,"caption":"Raquel Freitag"}},{"@type":"WebPage","@id":"https:\/\/blog.scielo.org\/es\/2025\/07\/18\/linguistica-para-una-inteligencia-artificial-ia-brasilena\/#webpage","url":"https:\/\/blog.scielo.org\/es\/2025\/07\/18\/linguistica-para-una-inteligencia-artificial-ia-brasilena\/","name":"Ling\u00fc\u00edstica para una inteligencia artificial (IA) brasile\u00f1a | SciELO en Perspectiva","description":"La Plataforma Brasile\u00f1a de Diversidad Ling\u00fc\u00edstica es una propuesta de curaci\u00f3n de datos para entrenar modelos de IA con datos estructurados del portugu\u00e9s y de otras 250 lenguas brasile\u00f1as, en apoyo directo al Plan Brasile\u00f1o de Inteligencia Artificial. La iniciativa busca reducir los costos ambientales, evitar sesgos y crear tecnolog\u00edas m\u00e1s inclusivas para la salud, la educaci\u00f3n y los servicios p\u00fablicos.","inLanguage":"en-US","isPartOf":{"@id":"https:\/\/blog.scielo.org\/es\/#website"},"breadcrumb":{"@id":"https:\/\/blog.scielo.org\/es\/2025\/07\/18\/linguistica-para-una-inteligencia-artificial-ia-brasilena\/#breadcrumblist"},"author":{"@id":"https:\/\/blog.scielo.org\/es\/author\/raquelfreitag\/#author"},"creator":{"@id":"https:\/\/blog.scielo.org\/es\/author\/raquelfreitag\/#author"},"image":{"@type":"ImageObject","url":"https:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2025\/07\/steve-johnson-_0iV9LmPDn0-unsplash.jpg","@id":"https:\/\/blog.scielo.org\/es\/2025\/07\/18\/linguistica-para-una-inteligencia-artificial-ia-brasilena\/#mainImage","width":1000,"height":563,"caption":"Imagem: Steve Johnson via Unsplash"},"primaryImageOfPage":{"@id":"https:\/\/blog.scielo.org\/es\/2025\/07\/18\/linguistica-para-una-inteligencia-artificial-ia-brasilena\/#mainImage"},"datePublished":"2025-07-18T13:45:44-03:00","dateModified":"2025-09-24T11:41:30-03:00"},{"@type":"WebSite","@id":"https:\/\/blog.scielo.org\/es\/#website","url":"https:\/\/blog.scielo.org\/es\/","name":"SciELO en Perspectiva","inLanguage":"en-US","publisher":{"@id":"https:\/\/blog.scielo.org\/es\/#organization"}}]},"og:locale":"en_US","og:site_name":"SciELO en Perspectiva","og:type":"article","og:title":"Ling\u00fc\u00edstica para una inteligencia artificial (IA) brasile\u00f1a | SciELO en Perspectiva","og:description":"La Plataforma Brasile\u00f1a de Diversidad Ling\u00fc\u00edstica es una propuesta de curaci\u00f3n de datos para entrenar modelos de IA con datos estructurados del portugu\u00e9s y de otras 250 lenguas brasile\u00f1as, en apoyo directo al Plan Brasile\u00f1o de Inteligencia Artificial. La iniciativa busca reducir los costos ambientales, evitar sesgos y crear tecnolog\u00edas m\u00e1s inclusivas para la salud, la educaci\u00f3n y los servicios p\u00fablicos.","og:url":"https:\/\/blog.scielo.org\/es\/2025\/07\/18\/linguistica-para-una-inteligencia-artificial-ia-brasilena\/","fb:admins":"SciELONetwork","article:published_time":"2025-07-18T16:45:44+00:00","article:modified_time":"2025-09-24T14:41:30+00:00","article:publisher":"https:\/\/www.facebook.com\/SciELONetwork","twitter:card":"summary","twitter:site":"@RedeSciELO","twitter:title":"Ling\u00fc\u00edstica para una inteligencia artificial (IA) brasile\u00f1a | SciELO en Perspectiva","twitter:description":"La Plataforma Brasile\u00f1a de Diversidad Ling\u00fc\u00edstica es una propuesta de curaci\u00f3n de datos para entrenar modelos de IA con datos estructurados del portugu\u00e9s y de otras 250 lenguas brasile\u00f1as, en apoyo directo al Plan Brasile\u00f1o de Inteligencia Artificial. La iniciativa busca reducir los costos ambientales, evitar sesgos y crear tecnolog\u00edas m\u00e1s inclusivas para la salud, la educaci\u00f3n y los servicios p\u00fablicos.","twitter:creator":"@RedeSciELO"},"aioseo_meta_data":{"post_id":"5780","title":null,"description":null,"keywords":null,"keyphrases":{"focus":{"keyphrase":"","score":0,"analysis":{"keyphraseInTitle":{"score":0,"maxScore":9,"error":1}}},"additional":[]},"primary_term":null,"canonical_url":null,"og_title":null,"og_description":null,"og_object_type":"default","og_image_type":"default","og_image_url":null,"og_image_width":null,"og_image_height":null,"og_image_custom_url":null,"og_image_custom_fields":null,"og_video":"","og_custom_url":null,"og_article_section":null,"og_article_tags":null,"twitter_use_og":false,"twitter_card":"default","twitter_image_type":"default","twitter_image_url":null,"twitter_image_custom_url":null,"twitter_image_custom_fields":null,"twitter_title":null,"twitter_description":null,"schema":{"blockGraphs":[],"customGraphs":[],"default":{"data":{"Article":[],"Course":[],"Dataset":[],"FAQPage":[],"Movie":[],"Person":[],"Product":[],"ProductReview":[],"Car":[],"Recipe":[],"Service":[],"SoftwareApplication":[],"WebPage":[]},"graphName":"Article","isEnabled":true},"graphs":[]},"schema_type":"default","schema_type_options":null,"pillar_content":false,"robots_default":true,"robots_noindex":false,"robots_noarchive":false,"robots_nosnippet":false,"robots_nofollow":false,"robots_noimageindex":false,"robots_noodp":false,"robots_notranslate":false,"robots_max_snippet":"-1","robots_max_videopreview":"-1","robots_max_imagepreview":"large","priority":null,"frequency":"default","local_seo":null,"seo_analyzer_scan_date":"2025-09-24 14:42:26","breadcrumb_settings":null,"limit_modified_date":false,"reviewed_by":null,"open_ai":null,"ai":{"faqs":[],"keyPoints":[],"titles":[],"descriptions":[],"socialPosts":{"email":[],"linkedin":[],"twitter":[],"facebook":[],"instagram":[]}},"created":"2025-07-18 16:07:44","updated":"2025-09-24 14:42:26"},"aioseo_breadcrumb":"<div class=\"aioseo-breadcrumbs\"><span class=\"aioseo-breadcrumb\">\n\t<a href=\"https:\/\/blog.scielo.org\/es\" title=\"Home\">Home<\/a>\n<\/span><span class=\"aioseo-breadcrumb-separator\">&raquo;<\/span><span class=\"aioseo-breadcrumb\">\n\t<a href=\"https:\/\/blog.scielo.org\/es\/category\/analisis\/\" title=\"An\u00e1lisis\">An\u00e1lisis<\/a>\n<\/span><span class=\"aioseo-breadcrumb-separator\">&raquo;<\/span><span class=\"aioseo-breadcrumb\">\n\tLing\u00fc\u00edstica para una inteligencia artificial (IA) brasile\u00f1a\n<\/span><\/div>","aioseo_breadcrumb_json":[{"label":"Home","link":"https:\/\/blog.scielo.org\/es"},{"label":"An\u00e1lisis","link":"https:\/\/blog.scielo.org\/es\/category\/analisis\/"},{"label":"Ling\u00fc\u00edstica para una inteligencia artificial (IA) brasile\u00f1a","link":"https:\/\/blog.scielo.org\/es\/2025\/07\/18\/linguistica-para-una-inteligencia-artificial-ia-brasilena\/"}],"_links":{"self":[{"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/posts\/5780","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/users\/130"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/comments?post=5780"}],"version-history":[{"count":2,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/posts\/5780\/revisions"}],"predecessor-version":[{"id":5814,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/posts\/5780\/revisions\/5814"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/media\/5781"}],"wp:attachment":[{"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/media?parent=5780"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/categories?post=5780"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/tags?post=5780"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}