Gemini estrena Lyria 3 para crear música con prompts y fotos

Google continúa ampliando el alcance creativo de su asistente de inteligencia artificial con el lanzamiento de Lyria 3 en la app de Gemini, un nuevo modelo capaz de generar pistas musicales a partir de texto, imágenes o documentos. La función, que se despliega en fase beta en la versión web y llegará en los próximos días a la app móvil para usuarios de todo el mundo, marca un nuevo paso en la estrategia de la compañía por convertir su asistente en una plataforma multimodal completa para la creación de contenido.

Lyria 3 permite a cualquier usuario crear una pista musical de 30 segundos describiendo una idea en un prompt o subiendo un archivo para que el sistema genere automáticamente letra y melodía. La herramienta no requiere conocimientos técnicos y ofrece control sobre elementos como el estilo musical, la voz o el tempo. Además, cada pista se acompaña de una portada generada automáticamente mediante el sistema de imágenes Nano Banana, integrando así audio e imagen en un mismo flujo creativo.

El principal avance del modelo es su enfoque multimodal. Con la función “De archivo a track”, el usuario puede subir una fotografía o documento para que el sistema analice el contexto y componga una pieza original en cuestión de segundos. El objetivo, según el lanzamiento, no es competir con la producción musical profesional, sino ofrecer una nueva forma de expresión accesible, rápida y compartible. Las pistas pueden descargarse o enviarse mediante enlace, facilitando su uso en redes sociales, podcasts o mensajes personales.

Música, después de las imágenes

El despliegue de Lyria 3 llega tras una serie de actualizaciones recientes de Gemini que han reforzado sus capacidades generativas. En los últimos meses, Google ha integrado generación de imágenes nativa en el asistente, herramientas de vídeo y mejoras en la comprensión multimodal, lo que permite trabajar con texto, audio, imágenes y documentos en un mismo entorno. Estas funciones se apoyan en la nueva generación de modelos Gemini, que buscan competir directamente con otros sistemas creativos en el ámbito de la IA generativa.

Entre los lanzamientos más recientes, Gemini ha incorporado herramientas para generar clips de vídeo cortos a partir de descripciones, editar imágenes con instrucciones en lenguaje natural y crear contenidos visuales personalizados desde cero. La integración progresiva de estas capacidades en una única app apunta a una estrategia clara: convertir el asistente en un estudio creativo impulsado por IA. Lyria 3 se inserta en ese enfoque al cubrir el ámbito musical, uno de los pocos terrenos donde la creación integrada aún estaba en fase inicial dentro del ecosistema de Gemini.

El modelo está diseñado para usos cotidianos. Desde la creación de una alarma personalizada o una felicitación de cumpleaños cantada hasta jingles para redes sociales, podcasts o contenido digital, la herramienta busca popularizar la generación musical rápida y personalizada. También abre la puerta a aplicaciones en educación o entretenimiento familiar, como la creación de canciones para rutinas infantiles o recordatorios en formato musical.

Sistemas creativos más multimodales

La propuesta se alinea con la tendencia del sector hacia sistemas creativos cada vez más multimodales y accesibles. A diferencia de herramientas musicales especializadas, Lyria 3 se integra en un asistente generalista, lo que permite generar audio en el mismo entorno donde se redactan textos, se crean imágenes o se analizan documentos. Esta convergencia es clave en la carrera por dominar la IA de consumo, donde las grandes tecnológicas buscan ofrecer plataformas todo en uno.

Con este lanzamiento, Google refuerza el posicionamiento de Gemini como un asistente creativo integral y amplía la competencia en el campo de la generación musical con IA. La fase beta servirá para evaluar la adopción y el uso real de la herramienta, pero el movimiento confirma que la creación sonora se convierte en el siguiente frente en la evolución de los asistentes generativos.

Gemini estrena Lyria 3 para crear música con prompts y fotos

La función se despliega en fase beta en la versión web y llegará en los próximos días a la app móvil en todo el mundo

Música, después de las imágenes

Sistemas creativos más multimodales