Aquesta setmana havia d’arribar el primer model open source d’OpenAI, però encara no està disponible. I el GPT-5? També es fa esperar! Tot i això, tenim novetats que podrien transformar completament la indústria. La més important: l’assalt als navegadors. I amb ells, a tot el sistema de publicitat i posicionament que Google ha dominat durant més de vint anys.
En paral·lel, la web per agents d’IA comença a ser una realitat. Una web pensada no només per a humans, sinó també per a agents automàtics. També ha sonat amb força que Meta podria abandonar parcialment —o totalment— els models Open Source. Després dels recursos invertits i els canvis interns, no ha sorprès gaire. Tot plegat s’afegeix a un moviment més ampli: la integració de la IA al món real —robots, cotxes autònoms i molt més— ja no és ciència-ficció. Cada dia és més a prop.
L’assalt als navegadors
Fins ara, utilitzàvem Chrome, Edge o Safari gairebé sense pensar-hi. Sembla un mercat estable i sense fissures. Però no! Perplexity ja ha llançat el seu navegador i OpenAI en té un de gairebé a punt. Què hi ha al darrere d’aquest moviment? Doncs ni més ni menys que la voluntat de redefinir el concepte de “cerca” (search) i tot el negoci de la publicitat, SEO, etc. que gira al seu voltant. La IA vol reinventar aquest espai i convertir-lo en quelcom completament nou. És l’inici del declivi de Google? Haurem d’esperar...
GPT-5: encara no, però…
OpenAI també ha posposat el llançament del seu model open source. Segons Sam Altman a X, volen fer-ho el millor possible. I ara que Grok 4 ja és al mercat, volen competir amb un model realment potent. No és fàcil. GPT-5, a més, serà un model que unificarà els anteriors i redirigirà automàticament les consultes cap al motor més adequat, segons la complexitat del raonament.
Tot i no estar disponible encara, ja s’han filtrat alguns resultats de benchmarks que són impressionants:
- SWE (programació): 90% d'encert, superant l’o3-pro (75%) i Grok 4 (73,5%). Fins ara Claude liderava el sector del software development. Ara, la lluita és oberta.
- GPQA (preguntes tècniques en l'àmbit de doctorat en STEM): 95% d’encert.
- AIME25 (problemes matemàtics per al top 5% d’universitaris): 100%.
- HLE (Humanities Last Exam): 56% — molt per sobre del 5% dels millors humans i també per sobre del 44,4% de Grok 4 la setmana passada.
Són resultats preliminars, però demostren la maduresa assolida per aquests models en tan sols dos anys. I això només és el principi.
Agents, cotxes i robots: la pròxima frontera
El següent pas seran els models especialitzats, els agents capaços de fer tasques per nosaltres, i la seva integració amb cotxes i robots. Un exemple clar? Tesla ja incorpora Grok 4 en alguns vehicles amb xips AMD. El conductor pot parlar amb l’assistent per obtenir informació o conèixer millor el cotxe. I aviat milloraran la conducció autònoma gràcies a una millor comprensió d’imatges. És el principi d’una nova interfície d’usuari per a tot: també per als cotxes.
OpenAI segueix perdent gent …
OpenAI segueix perdent figures clau que se’n van a Meta. Aquesta setmana, han marxat dos perfils importants:
- Janson Wei, investigador principal en agents i reasoning.
- Hyung Won Chung, responsable de Codex i un dels arquitectes de GPT-4.
Altres notícies destacades
- Google compra Windsurf per $2.4B, un agent de programació que complementarà Gemini. El pacte amb OpenAI s’ha complicat per les restriccions amb Microsoft.
- Microsoft estalvia $500M amb 9.000 acomiadaments. Potser no serà l’últim.
- LangChain arriba a un valor d’$1B després d’una nova ronda de finançament.
- Granola, una app canadenca que grava i resumeix converses. Ideal per a entrevistes.
- OpenAI quintuplica el valor de les stock options: ara hi dedica $4.4B anuals per retenir talent.
- Hugging Face ven un minirobot programable per $449. Un bon inici per aprendre robòtica!
- Els xips de Microsoft no van tan bé: van per darrere de Nvidia i Huawei.
- AWS obre una Agent Store, amb Anthropic com a soci.
- Huawei redissenya els seus xips per competir amb Nvidia.
- Nvidia torna a vendre a la Xina. Jensen Huang no ha perdut temps i ja ha fet un discurs en xinès.
- Thinking Machines Lab, de Mira Murati, aixeca $2B, surt de stealth i arriba a un valor de $12B.
- AWS presenta Bedrock AgentCore, una nova eina per escalar agents dins del seu entorn.