Setmana IA | K2 Thinking, GPT 5.1 i el robot de Xpeng

Aquesta setmana hem vist moltes novetats, però les més rellevants han estat el K2 Thinking i una nova versió, molt incremental, del GPT 5, la 5.1. K2 Thinking és un model de Moonshot, una companyia propietat al cent per cent d’Alibaba i basada en el seu model K2 de 1T de paràmetres, com veieu, un model realment immens.

Sobre aquesta base, Moonshot l’ha entrenat específicament per a tasques d’inferència i agents. El resultat és espectacular: és el primer model open source que supera alguns models comercials en diversos benchmarks.

També aquesta setmana hem tingut novetats de GPT: s’ha anunciat el nou GPT 5.1, una versió que feia temps que s’intuïa. Aquí, l’element diferencial és la seva capacitat d’adaptar-se millor al que demana l’usuari i com ho demana. I la infraestructura continua creixent. Anthropic ha anunciat una inversió de 50.000 milions de dòlars en centres de dades. La cursa per assegurar-se la màxima capacitat de computació segueix més viva que mai.

GPT 5.1

S’han presentat dues versions: GPT 5.1 Instant i GPT 5.1 Thinking. GPT 5.1 se centra a millorar la interacció humana: aconsegueix converses més naturals, segueix millor les instruccions i ajusta el consum computacional en funció de la dificultat de cada pregunta.

La versió Thinking és més empàtica, ofereix respostes més simples i naturals, sense tecnicismes innecessaris, i destaca sobretot per la seva capacitat d’adaptar el temps de processament segons la complexitat del problema. La versió Pro arribarà aviat.

També s’han refinat els diferents “caràcters” amb què es poden configurar els models, i s’hi ha canviat els noms: ara són Default, Professional, Friendly, Candid, Quirky, Efficient, Nerdy i Cynical.

Aquesta línia d’evolució, orientada a la personalització i a adaptar-se als gustos dels usuaris, anirà guanyant protagonisme. Veiem, doncs, com OpenAI avança cap a una IA més col·laborativa i personalitzada.

Kimi 2 Thinking

Kimi 2 és el model de Moonshot, un model gegantí de 1T de paràmetres, codi obert i força conegut a la Xina. Ara han llançat K2 Thinking, la versió optimitzada per a inferència, i immediatament s’ha situat per davant d’Anthropic i GPT5 en molts benchmarks. Un aspecte especialment rellevant és el seu rendiment en tasques agèntiques, on el model pot fer 200–300 crides a eines sense intervenció humana.

És molt bo en tres àrees: raonament, cerca agèntica i programació. La competició entre models open source i propietaris és més viva que mai i la supremacia americana comença a trontollar. Es tracta d’un model MoE (Mixture of Experts) amb 384 experts, dels quals només 8 s’activen per token.

Això permet que, tot i la seva mida, el cost computacional sigui relativament baix. L’entrenament incorpora nombroses innovacions i ha superat barreres importants. És un model a seguir molt de prop, no només pel seu rendiment, sinó per la contribució que suposa a l’estat de l’art.

Google TV incorpora Gemini

Google TV, similar a Apple TV, ja integra el model Gemini. Això permet demanar-li coses com: “busca una pel·lícula que agradi tant a mi com a la meva parella o als meus amics”, “resumeix-me els episodis anteriors” o “explica’m l’storyline de la sèrie”, entre moltes altres possibilitats. És un primer pas cap a eliminar definitivament el comandament a distància i substituir-lo per software del segle XXI. Tant de bo arribi aviat i ens alliberi d’aquests vestigis del segle XX.

El robot de Xpeng

La sensació de la setmana ha estat el robot de Xpeng. Xpeng és una empresa de vehicles elèctrics de Guangzhou. Ha fabricat menys d’un milió de cotxes, compta amb uns 15.000 empleats i actualment té tres models al mercat: un de similar al Tesla Y, un de més familiar i un compacte.

Malgrat la seva dimensió relativament modesta, té ambicions enormes. Aquests dies ha presentat el seu robot humanoide, IRON. L’hem vist caminar, ho fa millor que jo!, i és pràcticament indistingible d’un humà. La demostració va ser sorprenent, i fins i tot li van treure la roba per demostrar que no hi havia cap persona a dins. Xpeng també vol construir robotaxis i fins i tot un cotxe volador. Una empresa que caldrà seguir de prop, sens dubte.

La Unió Europea i l’'AI Act'

Era previsible, però ara ja sembla una realitat: la Comissió Europea vol posposar i suavitzar l’AI Act i part del GDPR. De moment, hi haurà un any de gràcia i una revisió de les obligacions relatives a les cookies, que pràcticament reduirà el nombre de clics necessaris per acceptar-les. En molts casos, bastarà una declaració interna. També s’ha ajornat l’aplicació de sancions en alguns casos d’alta transparència considerada de risc. Tot plegat respon a una forta pressió d’empreses europees —46 grans corporacions, incloent-hi Airbus i Mercedes—, dels governs i també dels Estats Units, que veuen aquesta regulació com una barrera.

La recerca en IA

Kimi K2 Thinking AI Lab: Moonshot

Kimi presenta K2 Thinking, el seu millor model de pensament open source. Funciona com un agent que raona pas a pas i utilitza eines de manera seqüencial, amb fins a 200–300 accions seguides. Aconsegueix resultats d’avantguarda en benchmarks com HLE i BrowseComp, i destaca en raonament, cerca i programació. Ja està disponible a kimi.com i aviat tindrà mode agèntic complet i accés via API.

The Era of Agentic Organization AI Lab: Microsoft Research
S’obre una nova etapa on diversos agents d’IA poden treballar alhora i en equip per resoldre problemes complexos. Presenten AsyncThink, un nou estil de raonament on una IA principal divideix un problema, el reparteix a altres agents, integra les respostes i construeix una solució final. És més ràpid (28% menys de temps), més precís i generalitza bé a tasques noves sense entrenament addicional.

Altres notícies

Cursor ha aixecat $2.3B amb una valoració de $29.3B.
Thinking Machines, l’empresa emergent de Mira Rurati, ja val $50B.
Google ha incorporat Deep Research al Notebook LLM3, una eina clau per a docents i estudiants.
Elon Musk assegura que presentarà el seu cotxe volador aquest mateix any.
Una empresa russa ha mostrat un robot que ha caigut de l’escenari al cap de pocs segons (sense ferir ningú).
Anthropic construirà centres de dades a Texas amb una inversió de $50B; fins ara depenien d’AWS i Google.
A la Xina, la competència entre xatbots és ferotge. Tongyi (Alibaba) queda enrere de Doubao (ByteDance) i Yuanbao (Tencent), d’aquí el seu rellançament.
Els models oberts d’OpenAI comencen a ser utilitzats per l’exèrcit dels Estats Units.
Anthropic experimenta amb robots, començant amb el gos d’Unitree, el Go2, de $16.900.
Waymo comença a operar de manera autònoma a autopistes a Los Angeles, Phoenix i San Francisco.
Yann LeCun deixa Meta; tot apunta que fundarà la seva pròpia startup.
Softbank ha venut totes les seves accions de Nvidia per $5.83B per finançar la seva inversió de $22.5B a OpenAI.
Google llança una nova versió del seu cloud privat, que afirma que és tan segura com l’execució local.