¿Echabas de menos una herramienta capaz de transcribir a texto grabaciones de voz capaz de entender –y reproducir en texto- las principales variedades dialectales del catalán? Pues ya existe: el proyecto Aina, una iniciativa promovida por la Generalitat y el Barcelona Supercomputing Center, la ha creado.

BSC Barcelona Supercomputing Center
 

En abierto

La nueva herramienta se llama Matxa es el primer modelo lingüístico en abierto que ofrece interpretación de texto a voz (Texto Tono Speech/TTS) en catalán central, nordoccidental, balear y valenciano. Matxa mantiene la naturalidad y las características de las voces escogidas para entrenarlo, procedentes de hablantes de varios dialectos, y supone un paso adelante en términos de rendimiento, con tiempos de ejecución muy bajos a través de redes neuronales.

Este avance tecnológico abre la puerta a varias aplicaciones prácticas para la interpretación de texto a voz en catalán. En este sentido, desde el proyecto Aina se trabaja con empresas e instituciones con el objetivo de desarrollar soluciones específicas basadas en esta tecnología de inteligencia artificial.

Ventajas

Disponer de una solución de texto a voz que incorpora variantes dialectales permite adaptar la síntesis de voz al dialecto específico de un usuario o región, mejorando la comprensión y la relevancia del mensaje, consigue que la comunicación sea más personalizada y facilita el acceso a la tecnología de síntesis de voz a una más amplio espectro de hablantes.

El modelo ya está disponible en la plataforma Hugging Face, la comunidad d'IA con recursos de código abierto, desde donde se pueden hacer pruebas con las voces a través de un demo pública, y conocer los detalles técnicos de la solución.