"No somos lo suficientemente conscientes de lo difícil que es que una máquina aprenda un idioma". Lo dice Dani Marco, director general de Innovació i Economia Digital de la Generalitat. Su dirección se encarga de impulsar proyectos relacionados con la inteligencia artificial, y esta semana han anunciado una campaña relacionada con el proyecto Aina, que tiene como objetivo enseñar las máquinas a hablar catalán. Marco asegura en declaraciones en ElNacional.cat que el Departament de Polítiques Digitals "ha hecho los deberes" impulsando este proyecto, porque pronostica que las lenguas minoritarias tienen que impulsar proyectos similares a este si no quieren acabar desapareciendo. Se trata, pues, de que la tecnología sea accesible para los catalanohablantes, y que no tengan que cambiar de lengua para dirigirse con su voz a sus móviles u ordenadores; una lengua que acostumbra a ser el castellano.

¿Pero todo eso cómo funciona? ¿Cómo se consigue que una máquina hable una lengua, concretamente el catalán? "La máquina acaba pasando por un proceso de inmersión lingüística", afirma en declaraciones a este medio Marta Villegas, responsable de minería de textos del Barcelona Supercomputing Center. Explica que para enseñar una máquina a hablar un idioma se utiliza una red neuronal artificial, que se trata, sencillamente, de un modelo que simula la manera con la cual el cerebro humano procesa la información. "Y datos, muchísimos datos," añade Marco. Estos datos son, sobre todo, ejemplos. Es por este motivo que el Govern ha iniciado una campaña en la cual pide colaboración ciudadana: que aquel que quiera entre en la página web del proyecto Aina y lea textos en voz alta.

Villegas detalla que es gracias a muchos ejemplos que una máquina acaba entendiendo cómo unos sonidos se pueden convertir en unas oraciones, y eso permite que en un futuro le proporciones una oración nueva y ella misma pueda convertirla en texto. Hay un elemento básico en todo este proceso, y es la predicción que puede hacer una máquina de lo que viene a continuación. Para poner un ejemplo, Villegas explica que hay un método que se basa en "enmascarar palabras". "Le proporcionas a la máquina un texto y le escondes unas cuantas palabras, y ella tiene que averiguar qué palabras se encontraban allí; tú le vas diciendo si la ha acertado o no, y así es como va aprendiendo", añade. Eso hace, en un futuro, que la máquina intuya las palabras que alguien quiere pronunciar o escribir; y eso tiene relación, por ejemplo, con los teclados predictivos que tienen algunos teléfonos inteligentes.

Instal·lacions del Barcelona Supercomputing Center (BSC)

Instalaciones del Barcelona Supercomputing Center

Aprender más idiomas

Se sabe que, con respecto a los humanos, saber varios idiomas facilita aprender otras lenguas. ¿Eso también pasa con las máquinas? Villegas menciona un modelo multilingüe desarrollado por Google, denominado mBert, que "ha sido entrenado con datos de 140 lenguas" y que sirve para facilitar el trabajo a las lenguas minoritarias. "Puedes aprovechar los datos que hay sobre una lengua grande", dice en referencia al inglés, el castellano o el francés, y "entrenarla con el catalán o una lengua que no tenga todavía aprendida".

La máquina y el humano

Villegas estuvo presente en el anuncio de la última campaña del proyecto Aina, y destacó la capacidad que ya tienen algunas máquinas de resumir información y escribir resúmenes. ¿Los periodistas, por lo tanto, acabarán perdiendo su trabajo? "¡No! Imposible", apunta la responsable de minería de textos de la Barcelona Supercomputing Center. Asegura que eso tampoco pasará con los traductores, pero sí que pasarán a tener "una muy buena herramienta". "Será como pasar de una máquina de escribir en un ordenador", insiste. De hecho, Dani Marco añade que "es un error asociar la inteligencia artificial con la inteligencia humana", porque "la diferencia entre los humanos y las máquinas es que las máquinas saben hacer solo una cosa muy bien; la hacen muy y muy bien, como jugar mejor al ajedrez que Kasparov, pero solo saben hacer aquella cosa".