Gemini estrena Lyria 3 per crear música amb prompts i fotos

Google continua ampliant l'abast creatiu del seu assistent d'intel·ligència artificial amb el llançament de Lyria 3 a l'app de Gemini, un nou model capaç de generar pistes musicals a partir de text, imatges o documents. La funció, que es desplega en fase beta en la versió web i arribarà en els pròxims dies a l'app mòbil per a usuaris de tot el món, marca un nou pas en l'estratègia de la companyia per convertir el seu assistent en una plataforma multimodal completa per a la creació de contingut.

Lyria 3 permet a qualsevol usuari crear una pista musical de 30 segons descrivint una idea en un prompt o pujant un arxiu perquè el sistema generi automàticament lletra i melodia. L'eina no requereix coneixements tècnics i ofereix control sobre elements com l'estil musical, la veu o el tempo. A més, cada pista s'acompanya d'una portada generada automàticament mitjançant el sistema d'imatges Nano Banana, integrant així àudio i imatge en un mateix flux creatiu.

El principal avenç del model és el seu enfocament multimodal. Amb la funció “De fitxer a track”, l'usuari pot pujar una fotografia o document perquè el sistema n'analitzi el context i compongui una peça original en qüestió de segons. L'objectiu, segons el llançament, no és competir amb la producció musical professional, sinó oferir una nova forma d'expressió accessible, ràpida i compartible. Les pistes es poden descarregar o enviar mitjançant enllaç, facilitant-ne l'ús a xarxes socials, podcasts o missatges personals.

Música, després de les imatges

El desplegament de Lyria 3 arriba després d'una sèrie d'actualitzacions recents de Gemini que han reforçat les seves capacitats generatives. En els últims mesos, Google ha integrat generació d'imatges nativa en l'assistent, eines de vídeo i millores en la comprensió multimodal, cosa que permet treballar amb text, àudio, imatges i documents en un mateix entorn. Aquestes funcions es recolzen en la nova generació de models Gemini, que busquen competir directament amb altres sistemes creatius en l'àmbit de la IA generativa.

Entre els llançaments més recents, Gemini ha incorporat eines per generar clips de vídeo curts a partir de descripcions, editar imatges amb instruccions en llenguatge natural i crear continguts visuals personalitzats des de zero. La integració progressiva d'aquestes capacitats en una única app apunta a una estratègia clara: convertir l'assistent en un estudi creatiu impulsat per IA. Lyria 3 s'insereix en aquest enfocament en cobrir l'àmbit musical, un dels pocs terrenys on la creació integrada encara estava en fase inicial dins de l'ecosistema de Gemini.

El model està dissenyat per a usos quotidians. Des de la creació d'una alarma personalitzada o una felicitació d'aniversari cantada fins a jingles per a xarxes socials, podcasts o contingut digital, l'eina busca popularitzar la generació musical ràpida i personalitzada. També obre la porta a aplicacions en educació o entreteniment familiar, com la creació de cançons per a rutines infantils o recordatoris en format musical.

Sistemes creatius més multimodals

La proposta s'alinea amb la tendència del sector cap a sistemes creatius cada cop més multimodals i accessibles. A diferència d'eines musicals especialitzades, Lyria 3 s'integra en un assistent generalista, la qual cosa permet generar àudio en el mateix entorn on es redacten textos, es creen imatges o s'analitzen documents. Aquesta convergència és clau en la carrera per dominar la IA de consum, on les grans tecnològiques busquen oferir plataformes tot en un.

Amb aquest llançament, Google reforça el posicionament de Gemini com un assistent creatiu integral i amplia la competència en el camp de la generació musical amb IA. La fase beta servirà per avaluar l'adopció i l'ús real de la ferramenta, però el moviment confirma que la creació sonora es converteix en el següent front en l'evolució dels assistents generatius.

Gemini estrena Lyria 3 per crear música amb prompts i fotos

La funció es desplega en fase beta en la versió web i arribarà en els pròxims dies a l'app mòbil a tot el món

Música, després de les imatges

Sistemes creatius més multimodals