El pasado mes de enero, durante la presentación de la serie de pódcast Evidentment del Institut d'Estudis Catalans y la Universitat Oberta de Catalunya sobre divulgación científica en catalán, la presidenta de la entidad normativa y la rectora de la UOC repasaron las principales novedades científicas y tecnológicas sobre las que versan los diversos episodios. Entre estas, como no podía ser de otra manera, estaba el ascenso del uso de la inteligencia artificial entre la población y como herramienta de búsqueda y entrada al conocimiento. En el acto, intervinieron la presidenta del IEC, Teresa Cabré, y la rectora de la UOC, Àngels Fitó, y también se contó con la asistencia de algunas de las voces expertas entrevistadas en los capítulos. Durante la conversación, se destacaron los posibles sesgos de la inteligencia artificial al dar sus respuestas, que parten del inmenso corpus de conocimiento que se les ha integrado y de entre el cual acaban produciendo las respuestas. En este sentido, Cabré destacó la corrección lingüística y normativa de estas, y al explicar su visita al Barcelona Supercomputing Center en el marco del desarrollo del proyecto Aina, se preguntó si se había tenido en cuenta a la hora de valorar las respuestas. La respuesta de aquellos expertos: no.

Y no solo eso. Más tarde, el IEC descubrió que, de hecho, herramientas tan populares como ChatGPT, el chatbot de IA de la compañía estadounidense OpenAI, no tienen acceso a la norma oficial del catalán y, por lo tanto, la corrección de sus respuestas no es necesariamente adecuada a la norma. Sin embargo, Cabré asegura que, aunque el Gobierno, en el marco del plan de recursos digitales, encargó a la Real Academia Española "la revisión de la canonicidad del modelo que salía, de si, efectivamente, los resultados eran de calidad o no lo eran". Ante esto se pregunta "¿por qué no se había hecho?" para las lenguas "cooficiales" como el catalán y reivindica que cuando, desde el Institut, consiguieron "entrar", fue entonces cuando llegaron a "un acuerdo". Después de reiteradas demandas de contacto por parte de ElNacional.cat con el Ministerio para la Transición Digital, no hemos conseguido ninguna declaración para aclarar estas afirmaciones de la directora del IEC ni sobre los esfuerzos que esté haciendo el Gobierno en este aspecto.

La IA no piensa en catalán

Ante las dudas de la directora del IEC, explica, resolvían que los chatbots usarían "la norma democrática", es decir, la procedente de todo el corpus de conocimiento que incorporan en sus cálculos. De hecho, la rectora de la UOC, Àngels Fitó, era igualmente clara y expresaba que la inteligencia artificial "contiene y trabaja a partir de unos ciertos sesgos, también lingüísticos. La inteligencia artificial no piensa en catalán. Seguramente, traduce al catalán lo que se piensa en otros lugares del mundo". Ante estos hechos, el IEC está trabajando en la creación de una herramienta que permita incorporar estas herramientas normativas de la lengua (diccionario, gramática y ortografía) entre los conocimientos que deben tener en cuenta los chatbots para responder a las preguntas que formulen los usuarios en catalán. Se trata de un proyecto que todavía se encuentra en una fase muy primigenia y que, por ahora, es puramente interno de la institución, es decir, no dispone del apoyo institucional ni económico del Govern ni del Gobierno u otras instituciones.

Desde ElNacional.cat hemos hablado con Robert Latorre, jefe del Servicio de Informática del Institut d'Estudis Catalans, sobre el estado del proyecto que está llevando a cabo la institución y su funcionamiento de cara al uso que se podrá hacer de él. Por ahora, y como también indica la oficina de prensa de la presidenta del IEC, el proyecto se encuentra en una fase piloto en la cual se está evaluando su viabilidad y los resultados que podría dar el desarrollo de un protocolo MCP (Model Context Protocol, por las siglas en inglés) que, de alguna manera, dirigirá a los algoritmos hacia el modelo para tener en cuenta lo que este les está diciendo. Para entenderlo fácilmente, el protocolo MCP "amplía el cerebro y la conciencia" de los chatbots para que usen las herramientas normativas del catalán cuando hablen con los usuarios.

De entrada, si se llegara a publicar este protocolo, tendrán que ser los mismos usuarios los que pidan a los chatbots —sobre todo los comerciales de marcas como ChatGPT, Gemini, Claude y otras— que usen este protocolo a la hora de responder a sus preguntas. Pero, como apunta Latorre, "de chatbots hoy en día se desarrollan muchísimos por cualquier página" y estos, con el trabajo de difusión tanto del IEC como de su red, sí que podrán incorporar la corrección lingüística en catalán de forma nativa porque será su programador el que habrá insertado el protocolo ya de forma universal para todos los usuarios. Dentro de todo esto, señala que el primer paso será incorporar el diccionario, "porque es tecnológicamente mucho más simple" y, más adelante, la Gramática y la Ortografía, "los tres pilares de la norma".

Pero, ¿cómo se dio cuenta el IEC de que esto pasaba, es decir, que las respuestas de los chatbots en catalán no se adecúan a la normativa vigente? "De la misma manera que la fruta cae del árbol", ironiza Latorre. "Porque los chatbots no responden de una manera normativamente correcta" y esto es lo que se ha hecho llegar a la institución tanto por parte de usuarios, como en sesiones públicas o diversos foros en línea. Este "es uno de los problemas que tiene que los modelos de lenguaje no estén concebidos directamente en catalán. Están pensados en inglés y, aunque a menudo responden bien en catalán, utilizan respuestas incorrectas" o "muchos calcos" con los cuales "se nota que no es la lengua original". "Y entonces", indica, "no se adaptan a la normativa catalana o las maneras más genuinas de hablar en catalán".

La responsabilidad del IEC

Y aquí llega, dice, el trabajo de la institución encargada de velar por la corrección de la lengua catalana. "Esto que estamos haciendo nosotros con la tecnología y las herramientas que tenemos es intentar acercar la norma, los recursos normativos, con una tecnología que es un protocolo estándar, para que la gente que tenga realmente esta sensibilidad pueda utilizarlo". A su parecer, el IEC tiene la "responsabilidad" de no quedarse al margen en un momento en el que cada vez más aumenta el uso de estas herramientas, tanto entre la gente joven como, cada vez más, el resto de la población.

Aunque el proyecto se encuentra en una fase muy embrionaria, esperan poder llegar tanto a la comunidad de usuarios en catalán como a los desarrolladores de herramientas de inteligencia artificial para que lo puedan introducir en los productos con los que estén trabajando. El objetivo es que "cualquier chatbot que se incorpore a cualquier plataforma podrá incorporar este recurso para contestar mejor en catalán".

¿Conseguir que la IA escriba bien en catalán es posible? El IEC se pone en marcha para conseguirlo

La IA no piensa en catalán

La responsabilidad del IEC