Així funciona la immersió lingüística per a màquines

Seguir a

“No som prou conscients de la dificultat que hi ha perquè una màquina aprengui un idioma”. Ho diu Dani Marco, director general d’Innovació i Economia Digital de la Generalitat. La seva direcció s’encarrega d’impulsar projectes relacionats amb la intel·ligència artificial, i aquesta setmana han anunciat una campanya relacionada amb el projecte Aina, que té per objectiu ensenyar les màquines a parlar català. Marco assegura en declaracions a ElNacional.cat que el Departament de Polítiques Digitals “ha fet els deures” impulsant aquest projecte, perquè pronostica que les llengües minoritàries han d’impulsar projectes similars a aquest si no volen acabar desapareixent. Es tracta, doncs, que la tecnologia sigui accessible per als catalanoparlants, i que no hagin de canviar de llengua per dirigir-se amb la veu als mòbils o ordinadors; una llengua que acostuma a ser el castellà.

Però tot això com funciona? Com s’aconsegueix que una màquina parli una llengua, concretament el català? “La màquina acaba passant per un procés d’immersió lingüística”, afirma en declaracions a aquest mitjà Marta Villegas, responsable de mineria de textos del Barcelona Supercomputing Center. Explica que per ensenyar una màquina a parlar un idioma s’utilitza una xarxa neuronal artificial, que es tracta, senzillament, d’un model que simula la manera amb la qual el cervell humà processa la informació. “I dades, moltíssimes dades”, afegeix Marco. Aquestes dades són, sobretot, exemples. És per aquest motiu que el Govern ha iniciat una campanya en la qual demana col·laboració ciutadana: que aquell qui vulgui entri a la pàgina web del projecte Aina i llegeixi textos en veu alta.

Villegas detalla que és gràcies a molts exemples que una màquina acaba entenent com uns sons es poden convertir en unes oracions, i això permet que en un futur li proporcionis una oració nova i ella mateixa pugui convertir-la en text. Hi ha un element bàsic en tot aquest procés, i és la predicció que pot fer una màquina del que ve a continuació. Per posar-ne un exemple, Villegas explica que hi ha un mètode que es basa a “emmascarar paraules”. “Li proporciones a la màquina un text i li amagues unes quantes paraules, i ella ha d’esbrinar quins mots hi havia; tu li vas dient si l’ha encertada o no, i així és com va aprenent”, afegeix. Això fa, en un futur, que la màquina intueixi les paraules que algú vol pronunciar o escriure; i això té relació, per exemple, amb els teclats predictius que tenen alguns telèfons intel·ligents.

Instal·lacions del Barcelona Supercomputing Center (BSC)

Instal·lacions del Barcelona Supercomputing Center

Aprendre més idiomes

Se sap que, pel que fa als humans, saber diversos idiomes facilita aprendre’n de nous. Això també passa amb les màquines? Villegas menciona un model multilingüe desenvolupat per Google, anomenat mBert, que “ha estat entrenat amb dades de 140 llengües” i que serveix per facilitar la feina a les llengües minoritàries. “Pots aprofitar les dades que hi ha sobre una llengua gran”, diu en referència a l’anglès, el castellà o el francès, i “entrenar-la amb el català o una llengua que no tingui encara apresa”.

La màquina i l’humà

Villegas ha estat present a l’anunci de la darrera campanya del projecte Aina, i ha destacat la capacitat que ja tenen algunes màquines de resumir informació i escriure’n resums. Els periodistes, per tant, acabaran perdent la feina? “No! Impossible”, apunta la responsable de mineria de textos del Barcelona Supercomputing Center. Assegura que això tampoc no passarà amb els traductors, però sí que passaran a tenir “una molt bona eina”. “Serà com passar d’una màquina d’escriure a un ordinador”, insisteix. De fet, Dani Marco afegeix que “és un error associar la intel·ligència artificial amb la intel·ligència humana”, perquè “la diferència entre els humans i les màquines és que les màquines saben fer només una cosa molt bé; la fan molt i molt bé, com jugar millor als escacs que Kaspàrov, però només saben fer aquella cosa”.

Més