El passat mes de gener, durant la presentació de la sèrie de pòdcast Evidentment de l'Institut d'Estudis Catalans i la Universitat Oberta de Catalunya sobre divulgació científica en català, la presidenta de l'entitat normativa i la rectora de la UOC van repassar les principals novetats científiques i tecnològiques sobre les quals versen els diversos episodis. Entre aquestes, com no podia ser d'altra manera, hi havia l'ascens de l'ús de la intel·ligència artificial entre la població i com a eina de cerca i entrada al coneixement. A l’acte, hi van intervenir la presidenta de l’IEC, Teresa Cabré, i la rectora de la UOC, Àngels Fitó, i també es va comptar amb l’assistència d’algunes de les veus expertes entrevistades en els capítols. Durant la conversa, es van destacar els possibles biaixos de la intel·ligència artificial en donar les seves respostes, que parteixen de l'immens corpus de coneixement que se'ls ha integrat i d'entre el qual acaben produint les respostes. En aquest sentit, Cabré va destacar la correcció lingüística i normativa d'aquestes, i tot explicant la seva visita al Barcelona Supercomputing Center en el marc del desenvolupament del projecte Aina, es va preguntar si s'havia tingut en compte a l'hora de valorar les respostes. La resposta d'aquells experts: no.

I no només això. Més tard, l'IEC va descobrir que, de fet, eines tan populars com ChatGPT, el xatbot d'IA de la companyia estatunidenca OpenAI, no tenen accés a la norma oficial del català i, per tant, la correcció de les seves respostes no és necessàriament adequada a la norma. Tanmateix, Cabré assegura que tot i que el govern espanyol, en el marc del pla de recursos digitals va encarregar a la Reial Acadèmia Espanyola "la revisió de la canonicitat del model que sortia, de si, efectivament, els resultats eren de qualitat o no ho eren". Davant d'això es pregunta "perquè no s'havia fet" per a les llengües "cooficials" com el català i reivindica que quan, des de l'Institut, van aconseguir "entrar", va ser aleshores quan van arribar a "un acord". Després de reiterades demandes de contacte per part d'ElNacional.cat amb el Ministeri per a la Transició Digital, no hem aconseguit cap declaració per aclarir aquestes afirmacions de la directora de l'IEC ni sobre els esforços que estigui fent el govern espanyol en aquest aspecte.

 

La IA no pensa en català

Davant els dubtes de la directora de l'IEC, explica, resolien que els xatbots farien servir "la norma democràtica", és a dir, la procedent de tot el corpus de coneixement que incorporen en els seus càlculs. De fet, la rectora de la UOC, Àngels Fitó, era igualment clara i expressava que la intel·ligència artificial "conté i treballa a partir d'uns certs baixos, també lingüístics. No pensa en català, la intel·ligència artificial. Segurament, tradueix al català el que es pensa en altres llocs del món". Davant d'aquests fets, l'IEC està treballant en la creació d'una eina que permeti incorporar aquestes eines normatives de la llengua (diccionari, gramàtica i ortografia) entre els coneixements que han de tenir en compte els xatbots per respondre a les preguntes que formulin els usuaris en català. Es tracta d'un projecte que encara es troba en una fase molt primigènia i que, ara per ara, és purament intern de la institució, és a dir, no disposa del suport institucional ni econòmic del Govern ni del govern espanyol o altres institucions. 

Des d'ElNacional.cat hem parlat amb Robert Latorre, cap del Servei d'Informàtica de l'Institut d'Estudis Catalans, sobre l'estat del projecte que està tirant endavant la institució i el seu funcionament de cara a l'ús que se'n podrà fer. Ara per ara, i com també indica l'oficina de premsa de la presidenta de l'IEC, el projecte es troba en una fase pilot en la qual se n'està avaluant la viabilitat i els resultats que podria donar el desenvolupament d'un protocol MCP (Model Context Protocol, per les sigles en angles) que, d'alguna manera, dirigirà als algoritmes cap al model per tenir en compte el que aquest els està dient. Per entendre-ho fàcilment, el protocol MCP "amplia el cervell i la consciència" dels xatbots perquè facin servir les eines normatives del català quan parlin amb els usuaris.

D'entrada, si s'arribés a publicar aquest protocol, hauran de ser els mateixos usuaris els que demanin als xatbots —sobretot els comercials de marques com ChatGPT, Gemini, Claude i altres— que facin servir aquest protocol a l'hora de respondre a les seves preguntes. Però, com apunta Latorre, "de xatbots avui en dia se'n desenvolupen moltíssims per qualsevol pàgina" i aquests, amb la feina de difusió tant de l'IEC com de la seva xarxa, sí que podran incorporar la correcció lingüística en català de forma nadiua perquè serà el seu programador el que haurà inserit el protocol ja de forma universal per a tots els usuaris. Dins de tot això, assenyala que el primer pas serà incorporar el diccionari, "perquè és tecnològicament molt més simple" i, més endavant, la Gramàtica i l'Ortografia, "els tres pilars de la norma". 

Però, com se'n va adonar l'IEC que això passava, és a dir, que les respostes dels xatbots en català no s'adeqüen a la normativa vigent? "De la mateixa manera que la fruita cau de l'arbre", ironitza Latorre. "Perquè els xatbots no responen d'una manera normativament correcta" i això és el que s'ha fet arribar a la institució tant per part d'usuaris, com en sessions públiques o diversos fòrums en línia. Aquest "és un dels problemes que té que els models de llenguatge no estiguin concebuts directament en català. Estan pensats en anglès i, tot i que sovint responen bé en català, utilitzen respostes incorrectes" o "molts calcs" amb els quals "es nota que no és la llengua original". "I aleshores", indica, "no s'adapten a la normativa catalana o les maneres més genuïnes de parlar en català". 

La responsabilitat de l'IEC

I aquí arriba, diu, la feina de la institució encarregada de vetllar per la correcció de la llengua catalana. "Això que estem fent nosaltres amb la tecnologia i les eines que tenim és mirar d'apropar la norma, els recursos normatius, amb una tecnologia que és un protocol estàndard, perquè la gent que tingui realment aquesta sensibilitat pugui utilitzar-lo". A parer seu, l'IEC té la "responsabilitat" de no quedar-se al marge en un moment en el qual cada cop més augmenta l'ús d'aquestes eines, tant entre la gent jove com, cada cop més, la resta de la població. 

Tot i que el projecte es troba en una fase molt embrionària, esperen poder arribar tant a la comunitat d'usuaris en català com als desenvolupadors d'eines d'intel·ligència artificial perquè ho puguin introduir als productes amb què estiguin treballant. L'objectiu és que "qualsevol xatbot que s'incorpori a qualsevol plataforma podrà incorporar aquest recurs per contestar millor en català".