OpenAI ha presentat el GPT Image 1.5, una actualització del seu model de generació d’imatges que promet redibuixar els estàndards del sector. L’anunci arriba en un moment de competència feroç amb el gegant tecnològic Google, que recentment ha desplegat els seus poderosos models Gemini 3 i Nano Banana Pro. La nova eina no és una simple actualització, sinó un salt qualitatiu que OpenAI descriu com a "multidimensional". La companyia garanteix millores radicals en quatre fronts principals: una qualitat visual sense precedents, una precisió quirúrgica en les edicions, velocitats de generació que quadrupliquen les de versions anteriors i un control creatiu inèdit per a l’usuari final. Aquest paquet d’innovacions posiciona directament el GPT Image 1.5 com a contrapès directe a les ofertes de Google, en una batalla per la supremacia del mercat de la IA gràfica que s’intensifica per hores.
Sam Altman no s'ha limitat a una descripció tècnica; ha il·lustrat les capacitats del nou model amb una imatge tan eficaç com sorprenent: una fotografia d’ell mateix, transformat en model d’un imaginari calendari de bombers. Aquesta imatge, generada íntegrament per la IA, serveix com a demostració pràctica dels avenços en realisme, consistència visual i control sobre elements com la il·luminació, l’expressió facial i l’estètica general. "És molt més que una eina professional; és una forma increïblement divertida de crear imatges entretingudes amb una facilitat abans impensable", ha declarat Altman, remarcant la voluntat de la companyia de fusionar l’alta capacitat tècnica amb una accessibilitat lúdica. Aquest doble enfocament cap a l’ús professional i el consumidor general és una pedra angular de la seva estratègia de mercat.
Més enllà de la generació
Una de les grans novetats resideix en la integració total de l’eina dins de l’ecosistema ChatGPT. GPT Image 1.5 ha deixat de ser un mòdul aïllat per convertir-se en el cor d’un estudi creatiu virtual accessible des de la barra lateral de la interfície principal. Aquest entorn unificat ofereix als usuaris, tant novells com avançats, eines intuïtives com prompts populars predefinits, filtres estilístics i una edició potentíssima. Aquesta condició permet un control gairebé pictòric sobre les creacions. Els usuaris podran ajustar amb precisió aspectes facials específics, manipular la direcció i qualitat de la llum, reconfigurar la composició de l’escena i afinar el to de color global, superant les limitacions de "cops únics" i iteracions inconsistents que plaguen altres models competidors.
El llançament s’emmarca en un context geopolític digital de màxima tensió. L’expansió agressiva de Google amb Gemini 3 i, sobretot, amb l'especialitzat Nano Banana Pro, havia començat a canviar els dinàmics del sector. La resposta d’OpenAI amb GPT Image 1.5 és ràpida i contundent, buscant neutralitzar l’avantatge competitiu del rival no només igualant-ne les funcions, sinó introduint noves capacitats que redefineixen el que es pot esperar d’una IA gràfica. Però la visió d’OpenAI va més enllà de l’estudi d’imatges. La companyia ha anunciat plans per enriquir radicalment la cerca informativa mitjançant elements visuals. En un futur pròxim, les consultes a ChatGPT podrien venir acompanyades de resultats il·lustrats amb fonts clares i visuals didàctics. En definitiva, amb GPT Image 1.5, OpenAI no només ha llençat un producte; ha llançat un repte. Un repte a Google, certament, però també als mateixos límits de la creativitat assistida per màquina. La batalla pels píxels intel·ligents acaba d’entrar en una nova fase.
