Trobaves a faltar una eina capaç de transcriure a text gravacions de veu capaç d’entendre –i reproduir en text- les principals varietats dialectals del català? Doncs ja existeix: el projecte Aina, una iniciativa promoguda per la Generalitat i el Barcelona Supercomputing Center, l’ha creada.

BSC Barcelona Supercomputing Center
 

En obert

La nova eina es diu Matxa és el primer model lingüístic en obert que ofereix interpretació de text a veu (Text To Speech/TTS) en català central, nord-occidental, balear i valencià. Matxa manté la naturalitat i les característiques de les veus escollides per a entrenar-lo, procedents de parlants de diversos dialectes, i suposa un pas endavant en termes de rendiment, amb temps d’execució molt baixos a través de xarxes neuronals.

Aquest avenç tecnològic obre la porta a diverses aplicacions pràctiques per a la interpretació de text a veu en català. En aquest sentit, des del projecte Aina es treballa amb empreses i institucions amb l’objectiu de desenvolupar solucions específiques basades en aquesta tecnologia d'intel·ligència artificial.

Avantatges

Disposar d’una solució de text a veu que incorpora variants dialectals permet adaptar la síntesi de veu al dialecte específic d'un usuari o regió, millorant la comprensió i la rellevància del missatge, aconsegueix que la comunicació sigui més personalitzada i facilita l'accés a la tecnologia de síntesi de veu a una més àmplia gamma de parlants.

El model ja està disponible a la plataforma Hugging Face, la comunitat d’IA amb recursos de codi obert, des d’on es poden fer proves amb les veus a través d’una demo pública, i conèixer els detalls tècnics de la solució.