Esta ha sido la semana de OpenAI. El lunes tuvo lugar el Dev Day, el día dedicado a los desarrolladores, una de las citas más esperadas del año por la empresa. OpenAI presentó tres grandes novedades relacionadas con agentes: uno para el público general y dos orientados a desarrolladores. Y, como era de esperar, también habló de Sora 2, su modelo de vídeo.

OpenAI trabaja con dos grandes visiones. La primera: crear un agente personal y profesional que nos ayude en todo, desde comprar en Amazon o planificar un viaje y dar consejos laborales o responder preguntas cotidianas. La segunda: conseguir el científico universal, un agente capaz de descubrir de manera autónoma todo aquello que la humanidad necesita saber.

Para hacerlo, la empresa ha tenido que abordar retos que quizás nunca había querido asumir, como construir una infraestructura de computación sin precedentes. Y también ha desarrollado aquello con lo que sí soñaba: el mejor programador automático que jamás hemos visto, capaz de trabajar sin descanso. Estos dos hitos ya son una realidad: OpenAI ha cerrado acuerdos para disponer de una infraestructura informática sin comparación, y ya cuenta con agentes que programan y revisan código durante horas sin intervención humana.

Todo esto surge de los transformers, una tecnología presentada modestamente por Google en 2017 que ha acabado transformando la IA. El punto de inflexión llegó con el modelo o1 de OpenAI, el verdadero GPT-4, que abrió la puerta a los modelos de razonamiento, capaces de mejorar sus respuestas no solo durante el entrenamiento sino también en tiempo real.

Hoy estos modelos compiten con matemáticos y programadores expertos, descubren biomarcadores y proponen nuevas moléculas. De momento, no se ve el final: más potencia de cálculo sigue traduciéndose en modelos más capaces. De ahí viene la carrera frenética actual. ¿El futuro? La investigación actual, los transformers, llegará a un límite, pero muchos creen que los próximos modelos podrán hacer avanzar la ciencia creando nuevas generaciones de sistemas inteligentes. No habrá un momento de "singularidad" repentino, sino un proceso gradual, pero transformador que cambiará el mundo tal como lo conocemos. La carrera de los centros de IA no se detiene, Sam Altman ha declarado que después de Stargate, Oracle, Nvidia y AMD, OpenAI anunciará aún más acuerdos.

Tres grandes novedades: Apps SDK, AgentKit y Codex, además de otros anuncios menores. La más destacada es Apps SDK, que permite interactuar con aplicaciones directamente desde ChatGPT. Por ejemplo, puedes reservar un hotel en Booking pidiendo a ChatGPT que busque el más cercano al centro con las mejores valoraciones, o consultar cursos en Coursera y preguntar detalles de las lecciones.

Hoy solo hay unas pocas aplicaciones, pero OpenAI espera multiplicarlas pronto. En un futuro próximo, podríamos ver búsqueda inteligente en Amazon o trámites administrativos sin burocracia, gracias a un copiloto que entiende y actúa por nosotros. Esta función no solo amplía las capacidades de ChatGPT, sino que también abre una nueva vía de monetización y consolida OpenAI como plataforma tecnológica más allá de la web tradicional.

El segundo anuncio, AgentKit, permite crear agentes de una manera más intuitiva. Aunque ya existen plataformas similares (Zapier, Make, n8n), esta versión está más pensada para desarrolladores. Muchos esperaban una herramienta más visual y accesible con lenguaje natural y no una interfaz gráfica que se ve antigua, pero el interés de AgentKit radica en la posibilidad de integrar código Python en cualquier entorno, ahora bien, no lo pone demasiado fácil. Esperamos que evolucione rápido.

Finalmente, OpenAI anunció mejoras a Codex, su agente para programadores, que compite con Cursor, líder actual del sector. También presentó nuevas librerías de voz y la disponibilidad de Sora 2 y GPT-5 Pro para desarrolladores. Codex está evolucionando muy rápidamente y es muy posible que adelante a Cursor pronto. En resumen: Apps SDK puede cambiar cómo aprendemos, compramos o interactuamos con la red, mientras que AgentKit y Codex consolidan el papel de los agentes en el desarrollo tecnológico.

 

Figure AI, el robot que hace las tareas del hogar

La empresa americana Figure AI ha presentado su nuevo robot, Figure 03, capaz de doblar ropa, poner platos en el lavavajillas o hacer de camarero. Con 1,68 metros de altura y una capacidad de carga de 20 kg, puede trabajar durante cinco horas seguidas. Su gran ventaja es Helix, un software que utiliza modelos de lenguaje multimodales para comprender y adaptarse a cada tarea. Está pensado para sectores como la restauración, la limpieza y la atención a personas mayores. Los primeros ejemplares se prevén para 2026.

Gemini Enterprise, la plataforma de Google

Google responde a la carrera de los agentes con Gemini Enterprise, una plataforma que lleva la IA al corazón de las empresas. Permite crear asistentes sin saber programar, conectados a Box, Microsoft 365 o Salesforce, con un sistema de seguridad (Model Armor) que evita filtraciones de datos. Los usos prácticos son inmediatos: equipos comerciales que reciben resúmenes automáticos de clientes, servicios de atención que generan respuestas a partir de documentos o departamentos de finanzas que pueden activar procesos directamente desde el chat. Es la respuesta de Google en un espacio donde OpenAI y Microsoft ya compiten fuerte, y donde la batalla por los agentes corporativos apenas comienza.

 

La investigación en IA

Less is More: Recursive Reasoning with Tiny Networks
AI Lab: Samsung SAIL Montréal

Un nuevo modelo de inteligencia artificial, Tiny Recursive Model (TRM), ha demostrado que, con muchos menos recursos, puede resolver mejor problemas complejos que muchos modelos gigantes actuales. Inspirado en el cerebro humano, utiliza solo dos capas y siete millones de parámetros, una fracción ínfima de los grandes modelos, pero supera a sistemas como DeepSeek o Gemini en retos como el Sudoku o la resolución de laberintos. Esta investigación demuestra que la potencia de la IA no depende solo del tamaño, sino de cómo razona y aprende.

Otras noticias

  • Sora 2 supera el millón de descargas, por delante incluso de ChatGPT.
  • La entrevista de a16z a Sam Altman revela gran parte de la visión de OpenAI sobre el futuro de la IA —imperdible.
  • Tesla presenta el FSD 14.1, la nueva versión de su sistema de conducción autónoma, más suave y natural en aparcamientos y trayectos urbanos. 
  • Tesla también ha vendido más coches que Mercedes-Benz por primera vez en su historia.
  • Google lanza Gemini 2.5 Computer Use, capaz de interactuar plenamente con páginas web: un paso más hacia los agentes web autónomos.
  • OpenAI y AMD cierran un acuerdo para construir una infraestructura de 6 GW con GPUs AMD, similar al reciente acuerdo con Nvidia.