Google ha presentat l'evolució del seu generador d'imatges Nano Banana Pro, conegut tècnicament com Gemini 3 Pro Image. A diferència dels models anteriors, com Gemini 2.5 Flash Image, que se centraven en l'edició ràpida i la creativitat casual, aquesta nova iteració es posiciona com una solució seriosa i avançada. Amb Nano Banana Pro, la IA ja no només es limita a dibuixar imatges visualment atractives, sinó que entén, conceptualitza i raona sobre el que està creant, resolent les limitacions històriques de la incoherència i els errors gràfics.
La principal deficiència respecte a altres generadors d'imatges era la seva incapacitat per connectar la representació visual amb el coneixement fàctic o conceptual. Aquesta desconnexió resultava en diagrames imprecisos, receptes visualment correctes però conceptualment errònies, i el tristament cèlebre problema de les lletres deformes. Nano Banana Pro ataca aquesta limitació mitjançant l'ús del raonament avançat de Gemini 3.
Nano Banana Pro: La IA que genera textos i imatges perfectes
Amb aquest nou model, la imatge passa de ser un art basat en la difusió a una eina de visualització d'informació que ofereix precisió conceptual, en ser capaç de generar infografies i diagrames precisos i contextuals que es basen en la informació proporcionada per l'usuari i en fets del món real.
Models d'Infografies creades amb Nano Banana Pro
Així mateix, aquesta actualització destaca per la seva connexió en temps real. Potser la característica més innovadora és la seva capacitat de connectar-se a la vasta base de coneixement de Google Search. Això permet visualitzar informació en temps real. Per exemple, es pot sol·licitar una instantània ràpida d'una recepta d'Elaichi Chai o un gràfic pop-art amb la previsió meteorològica actual d'una ciutat, i el model utilitzarà dades obtingudes a l'instant.
Adéu al text intangible
Textos generats per Nano Banana Pro
Un dels talons d'Aquil·les més frustrants de la generació d'imatges per IA era la incapacitat dels models per produir text llegible. Qualsevol intent d'incloure un cartell o un logotip resultava en gargots incomprensibles.
Nano Banana Pro presumeix de ser el millor model creat fins ara a renderitzar text correcte i llegible directament a la imatge, ja sigui una frase curta o un paràgraf complet. Això s'aconsegueix perquè la IA ara entén la profunditat i el matís del text que ha d'incorporar, eliminant l'aleatorietat visual.
La IA que crea com a professional
Per a l'usuari professional i les empreses, Nano Banana Pro ofereix capacitats de consistència i control fi que abans eren inabastables:
- Consistència de disseny massiva: el model és capaç de mantenir la coherència i semblança de fins a cinc persones i un total de catorze imatges d'entrada en una única composició complexa. Això és crucial per a mantenir la identitat visual de personatges o el branding de productes en diferents angles.
- Edició localitzada avançada: ofereix controls de qualitat d'estudi que permeten refinar i transformar qualsevol part d'una imatge amb precisió. És possible ajustar la il·luminació (canviar una escena de dia a nit), modificar els angles de càmera, l'enfocament i crear efectes visuals com el bokeh.
- Resolució per a producció: Les creacions estan llestes per a qualsevol plataforma, amb una varietat de relacions d'aspecte i la capacitat de generar contingut en resolucions de 2K i 4K.
Google està desplegant Nano Banana Pro en tota la seva gamma de productes, des de l'aplicació Gemini fins a Google Ads i Google Slides. Aquesta vegada, la companyia ha donat un cop d'autoritat, en demostrar la capacitat del seu programari per a convertir-se en una eina seriosa i conceptualment precisa per a la visualització de dades, el prototipatge i la creació de contingut d'alta fidelitat.
