Esta semana tenía que llegar el primer modelo open source de OpenAI, pero todavía no está disponible. ¿Y el GPT-5? También se hace esperar. Aun así, tenemos novedades que podrían transformar por completo la industria. La más importante: el asalto a los navegadores. Y con ellos, a todo el sistema de publicidad y posicionamiento que Google ha dominado durante más de veinte años.
Paralelamente, la web para agentes de IA empieza a ser una realidad. Una web pensada no solo para humanos, sino también para agentes automáticos. También ha sonado con fuerza que Meta podría abandonar parcial —o totalmente— los modelos open source. Después de los recursos invertidos y los cambios internos, no ha sorprendido demasiado.
Todo esto se suma a un movimiento más amplio: la integración de la IA en el mundo real —robots, coches autónomos y mucho más— ya no es ciencia ficción. Cada día está más cerca.
El asalto a los navegadores
Hasta ahora, usábamos Chrome, Edge o Safari casi sin pensarlo. Parecía un mercado estable y sin fisuras. ¡Pero no! Perplexity ya ha lanzado su navegador y OpenAI tiene uno casi listo.
¿Qué hay detrás de este movimiento? Ni más ni menos que la voluntad de redefinir el concepto de “búsqueda” (search) y todo el negocio de la publicidad, el SEO, etc., que gira a su alrededor. La IA quiere reinventar este espacio y convertirlo en algo completamente nuevo. ¿Es el inicio del declive de Google? Habrá que esperar...
GPT-5: todavía no, pero…
OpenAI también ha pospuesto el lanzamiento de su modelo open source. Según Sam Altman en X, quieren hacerlo lo mejor posible. Y ahora que Grok 4 ya está en el mercado, quieren competir con un modelo realmente potente. No es fácil. GPT-5, además, será un modelo que unificará los anteriores y redirigirá automáticamente las consultas hacia el motor más adecuado, según la complejidad del razonamiento.
Aunque todavía no está disponible, ya se han filtrado algunos resultados de benchmarks que son impresionantes:
- SWE (programación): 90% de acierto, superando al o3-pro (75%) y a Grok 4 (73,5%). Hasta ahora Claude lideraba el sector del desarrollo de software. Ahora, la lucha está abierta.
- GPQA (preguntas técnicas a nivel de doctorado en STEM): 95% de acierto.
- AIME25 (problemas matemáticos para el top 5% de estudiantes universitarios): 100%.
- HLE (Humanities Last Exam): 56% — muy por encima del 5% de los mejores humanos y también por encima del 44,4% de Grok 4 la semana pasada.
Son resultados preliminares, pero demuestran la madurez alcanzada por estos modelos en tan solo dos años. Y esto solo es el principio.
Agentes, coches y robots: la próxima frontera
El siguiente paso serán los modelos especializados, los agentes capaces de hacer tareas por nosotros, y su integración en coches y robots.
¿Un ejemplo claro? Tesla ya incorpora Grok 4 en algunos vehículos con chips AMD. El conductor puede hablar con el asistente para obtener información o conocer mejor el coche. Y pronto mejorará la conducción autónoma gracias a una mejor comprensión de imágenes. Es el inicio de una nueva interfaz de usuario para todo: también para los coches.
OpenAI sigue perdiendo gente...
OpenAI sigue perdiendo figuras clave que se van a Meta. Esta semana, se han ido dos perfiles importantes:
- Janson Wei, investigador principal en agentes y reasoning.
- Hyung Won Chung, responsable de Codex y uno de los arquitectos de GPT-4.
Otras noticias destacadas
- Google compra Windsurf por $2.4B, un agente de programación que complementará a Gemini. El acuerdo con OpenAI se ha complicado por las restricciones con Microsoft.
- Microsoft ahorra $500M con 9.000 despidos. Tal vez no sean los últimos.
- LangChain alcanza un valor de $1B tras una nueva ronda de financiación.
- Granola, una app canadiense que graba y resume conversaciones. Ideal para entrevistas.
- OpenAI quintuplica el valor de las stock options: ahora dedica $4.4B anuales a retener talento.
- Hugging Face vende un mini robot programable por $449. ¡Un buen inicio para aprender robótica!
- Los chips de Microsoft no van tan bien: están por detrás de Nvidia y Huawei.
- AWS abre una Agent Store, con Anthropic como socio.
- Huawei rediseña sus chips para competir con Nvidia.
- Nvidia vuelve a vender en China. Jensen Huang no ha perdido el tiempo y ya ha pronunciado un discurso en chino.
- Thinking Machines Lab, de Mira Murati, levanta $2B, sale del modo stealth y alcanza un valor de $12B.
- AWS presenta Bedrock AgentCore, una nueva herramienta para escalar agentes dentro de su entorno.