Aquesta setmana, tot el sector tecnològic està pendent de l’anunci del GPT-5. La setmana passada ja us vam presentar alguns benchmarks filtrats, però sabem que hi ha molt més. S’espera que unifiqui els models existents i introdueixi capacitats inèdites... tot i que, per ara, només podem especular. Mentrestant, el món no s’ha aturat. Tot el contrari!
La gran notícia ha estat un robot, amb un nivell de dextralitat totalment inesperat i un preu encara més inesperat. Tothom sap que la robòtica ens canviarà la vida, però aquest robot és la plasmació que ho farà molt més de pressa del que ningú de nosaltres somiava. Aquesta setmana, però, han passat moltes més coses ...
Unitree R1, la nova dimensió dels robots
Unitree, una empresa xinesa de Hangzhou, ha sorprès tothom amb el seu nou robot humanoide R1. Amb 1,20 m d’alçada, 25 kg de pes, una autonomia d’una hora i un preu de només 5.900 dòlars, el R1 té una destresa sorprenent. Penseu que un simple braç robòtic d’un metre pot costar més del doble.
A més, es pot connectar amb DeepSeek. Unitree, coneguda pels seus robots gossos (Go1/Go2), molt populars en fires, va ser fundada per Wang Xingxing, enginyer format a Shanghai que abans treballava a DJI, el gegant mundial dels drons. El R1 obre la porta a interfícies avançades impulsades per models de llenguatge. El seu preu reconfigura tot el mercat i posa pressió directa sobre competidors com Optimus (Tesla) i Boston Dynamics.
L'Optimus de Tesla
Optimus acumula retards. Elon Musk havia promès 5.000 unitats aquest any, però només n’han fabricat uns centenars. L’objectiu de produir més d’un milió d’unitats el 2030 sembla lluny. A més, Milan Kovac, director d’enginyeria del projecte, ha deixat Tesla després de nou anys. I recentment, la companyia ha denunciat Proception, una startup fundada per un ex-Tesla i accelerada per Y Combinator. Els principals reptes es troben ara en el desenvolupament d’una mà robòtica amb la mateixa precisió que una humana. El seu "test de Turing"? Que pugui tocar el piano de forma indistingible d’un humà. Un repte majúscul.
El vídeo sota control total
Runway ha presentat Aleph, el seu nou model de vídeo, amb millores importants en realisme i fidelitat. Aleph no només genera vídeos: permet canviar l’angle de la càmera, modificar fons, substituir objectes (d’un cotxe a un carruatge, per exemple), alterar l’aspecte de personatges (envellir o rejovenir), afegir o eliminar elements, i aplicar l’estil i moviment d’un vídeo a una imatge.
Amb Aleph i Veo3 de Google, ens acostem al somni de fer pel·lícules a partir de text. Ja comença a utilitzar-se: Netflix l’ha fet servir a L’Eternauta i IMAX projectarà curts generats amb IA del festival patrocinat per Runway. Altres actors com Luma AI també estan entrant a Hollywood. I a més, aquestes empreses han trobat un nínxol inesperat: generar clips per entrenar cotxes autònoms i robots. I per si no n’hi hagués prou, Tencent ha llençat un model capaç de crear mons virtuals a partir de text. Prepareu-vos per una allau d’ulleres 3D aquest Nadal.
El tutor personal ja és aquí
OpenAI ha llançat una nova funcionalitat: Estudiar i Aprendre, disponible des del panell d’eines. Indiques què vols aprendre i l’eina et guia pas a pas amb exercicis i tutorització. És com tenir un professor particular, però infinitament pacient i personalitzable. Una autèntica oportunitat per posar-se al dia amb qualsevol disciplina.
Cursor, l’agent d’IA per desenvolupadors, ha esclatat... a la Xina! Els motius? Diversos. D'una banda, la predisposició dels desenvolupadors xinesos a adoptar noves tecnologies. Però sobretot, un fet clau: Cursor permet accedir a models occidentals bloquejats a la Xina. És a dir, Cursor ho peta a la Xina!
'Non-code': el codi, en llenguatge natural
En el món del non-code (aplicacions sense programació), hi ha molta activitat.
- Microsoft ha presentat Github Spark, integrat dins Copilot Pro+, basat en el model Claude d’Anthropic. Només cal descriure què vols i Spark ho crea.
- Google ha llançat Opal, una eina més visual que et permet fer miniapps només amb llenguatge natural, amb una seqüència editable de passos.
IA al món de la moda
Vogue ha publicat un anunci de Guess amb una model generada per IA. No ha estat una decisió editorial, però ha generat controvèrsia. Tot i que s’afirma que les models d’IA són un complement i no un substitut, la tendència és clara. L’ús d’avatars estàndard no ha generat tracció fins ara, però això pot canviar ràpidament.
MIT i els tutors digitals
El programa MIT Open Learning, amb 11.000 estudiants, aspira a arribar a mil milions. Ara, incorpora un assistent d’IA que t’ajuda a trobar el curs més adequat i un tutor virtual que no et dona respostes directes, sinó que t’ajuda a raonar-les. Aquesta aposta se suma a la línia de Khan Academy. I el següent pas? Vídeo generat per IA amb què puguis dialogar amb personatges en pantalla. No trigarà.
La Xina impulsa la governança global de la IA
Li Qiang, primer ministre xinès, ha proposat a Shanghai un model global de governança per a la IA. L’objectiu? Equilibrar desenvolupament i seguretat. I s’ha ofert a compartir coneixement amb el Sud Global, en línia amb la seva estratègia AI+.
Qui fa els models d’OpenAI?
Training Data és el videocast d’OpenAI on entrevisten els creadors dels models. En un episodi recent, entrevisten els responsables del model que va guanyar la medalla d’or en matemàtiques creat per tres persones (sí, tres!), en només dos mesos, i liderat per un sol autor.
Altres notícies destacades
- Meta triplica les vendes de les ulleres Ray-Ban durant el primer semestre de 2025.
- NVIDIA fa una nova comanda de 300.000 xips H20 per al mercat xinès.
- Samsung fabricarà els xips de Tesla (2 nm), en un acord de 16,5B$.
- Waymo ja opera robotaxis a Dallas. Aviat... Londres?
- Meta contracta tres investigadors ex-Google guanyadors de l’Olimpíada Matemàtica.
- Suno llança un canal musical amb programació contínua 24h.
- Estònia integra IA a les escoles.
- Groq (competidora de Nvidia) rebaixa la seva valoració de 2B$ a 1,5B$.
- Cerebras ajorna la seva IPO i busca 1B$ de capital.
- Meta prepara un smartwatch amb càmera de 12MP i frontal de 5MP.
- Microsoft Edge estrenarà mode Copilot.
- NotebookLLM ja pot generar vídeos explicatius, no només pòdcasts.
- UK implementa verificació d’edat per accedir a porno... i les VPN creixen un 1.400%.
- OpenAI arriba als 12B$ de facturació amb 700M d’usuaris actius setmanals.
- Meta creix un 22% al segon trimestre; Microsoft, un 18%.