Aquesta setmana havia d’arribar el primer model open source d’OpenAI, però encara no està disponible. I el GPT-5? També es fa esperar! Tot i això, tenim novetats que podrien transformar completament la indústria. La més important: l’assalt als navegadors. I amb ells, a tot el sistema de publicitat i posicionament que Google ha dominat durant més de vint anys.

En paral·lel, la web per agents d’IA comença a ser una realitat. Una web pensada no només per a humans, sinó també per a agents automàtics. També ha sonat amb força que Meta podria abandonar parcialment —o totalment— els models Open Source. Després dels recursos invertits i els canvis interns, no ha sorprès gaire. Tot plegat s’afegeix a un moviment més ampli: la integració de la IA al món real —robots, cotxes autònoms i molt més— ja no és ciència-ficció. Cada dia és més a prop.

L’assalt als navegadors

Fins ara, utilitzàvem Chrome, Edge o Safari gairebé sense pensar-hi. Sembla un mercat estable i sense fissures. Però no! Perplexity ja ha llançat el seu navegador i OpenAI en té un de gairebé a punt. Què hi ha al darrere d’aquest moviment? Doncs ni més ni menys que la voluntat de redefinir el concepte de “cerca” (search) i tot el negoci de la publicitat, SEO, etc. que gira al seu voltant. La IA vol reinventar aquest espai i convertir-lo en quelcom completament nou. És l’inici del declivi de Google? Haurem d’esperar...

GPT-5: encara no, però…

OpenAI també ha posposat el llançament del seu model open source. Segons Sam Altman a X, volen fer-ho el millor possible. I ara que Grok 4 ja és al mercat, volen competir amb un model realment potent. No és fàcil. GPT-5, a més, serà un model que unificarà els anteriors i redirigirà automàticament les consultes cap al motor més adequat, segons la complexitat del raonament.

Tot i no estar disponible encara, ja s’han filtrat alguns resultats de benchmarks que són impressionants:

  • SWE (programació): 90% d'encert, superant l’o3-pro (75%) i Grok 4 (73,5%). Fins ara Claude liderava el sector del software development. Ara, la lluita és oberta.
  • GPQA (preguntes tècniques en l'àmbit de doctorat en STEM): 95% d’encert.
  • AIME25 (problemes matemàtics per al top 5% d’universitaris): 100%.
  • HLE (Humanities Last Exam): 56% — molt per sobre del 5% dels millors humans i també per sobre del 44,4% de Grok 4 la setmana passada.

Són resultats preliminars, però demostren la maduresa assolida per aquests models en tan sols dos anys. I això només és el principi.

Agents, cotxes i robots: la pròxima frontera

El següent pas seran els models especialitzats, els agents capaços de fer tasques per nosaltres, i la seva integració amb cotxes i robots. Un exemple clar? Tesla ja incorpora Grok 4 en alguns vehicles amb xips AMD. El conductor pot parlar amb l’assistent per obtenir informació o conèixer millor el cotxe. I aviat milloraran la conducció autònoma gràcies a una millor comprensió d’imatges. És el principi d’una nova interfície d’usuari per a tot: també per als cotxes.

OpenAI segueix perdent gent …

OpenAI segueix perdent figures clau que se’n van a Meta. Aquesta setmana, han marxat dos perfils importants:

  • Janson Wei, investigador principal en agents i reasoning.
  • Hyung Won Chung, responsable de Codex i un dels arquitectes de GPT-4.

Altres notícies destacades

  • Google compra Windsurf per $2.4B, un agent de programació que complementarà Gemini. El pacte amb OpenAI s’ha complicat per les restriccions amb Microsoft.
  • Microsoft estalvia $500M amb 9.000 acomiadaments. Potser no serà l’últim.
  • LangChain arriba a un valor d’$1B després d’una nova ronda de finançament.
  • Granola, una app canadenca que grava i resumeix converses. Ideal per a entrevistes.
  • OpenAI quintuplica el valor de les stock options: ara hi dedica $4.4B anuals per retenir talent.
  • Hugging Face ven un minirobot programable per $449. Un bon inici per aprendre robòtica!
  • Els xips de Microsoft no van tan bé: van per darrere de Nvidia i Huawei.
  • AWS obre una Agent Store, amb Anthropic com a soci.
  • Huawei redissenya els seus xips per competir amb Nvidia.
  • Nvidia torna a vendre a la Xina. Jensen Huang no ha perdut temps i ja ha fet un discurs en xinès.
  • Thinking Machines Lab, de Mira Murati, aixeca $2B, surt de stealth i arriba a un valor de $12B.
  • AWS presenta Bedrock AgentCore, una nova eina per escalar agents dins del seu entorn.