La semana ha estado marcada por el anuncio de OpenAI de Sora 2, un modelo que genera vídeos a partir de prompts y que compite, incluso supera, el Veo3 de Google. Las capacidades actuales de producir vídeo con sonido y movimiento de un realismo sorprendente ya son muy avanzadas y cuesta distinguirlos de la realidad. Además, abren la puerta a imaginar mundos alternativos con una facilidad extraordinaria (por ejemplo, jugar al polo con unicornios). Pero esta no ha sido la única novedad.
El campo de la IA madura muy rápidamente y cada vez vemos más propuestas que permiten adaptar los modelos a sectores concretos y a necesidades empresariales. También proliferan los anuncios sobre su aplicación en ámbitos como la interacción con clientes, la educación o el soporte de producto. Campos que cambiarán mucho y muy rápidamente. También en investigación ha sido una semana intensa, con nuevas propuestas en biomedicina, química y, sobre todo, educación.
Sora 2, el generador de vídeos con personas reales
OpenAI ha presentado Sora 2, un modelo que genera vídeos con voz y puede incluir a personas reales como si hicieran un cameo. El modelo impresiona por su precisión al entender las leyes del mundo físico y por el realismo que consigue. La calidad alcanzada ya permite que se utilice en publicidad, cine, televisión (incluyendo boletines informativos) y, en general, en todo tipo de producciones: documentales, contenidos educativos y formación.
Un aspecto distintivo es su estrategia de lanzamiento. Inicialmente, se presenta en forma de aplicación (de momento solo en Estados Unidos y Canadá, exclusivamente para iPhone), muy similar a TikTok, pero con la particularidad de que todos los vídeos (de 10 segundos) son creados por Sora 2. Pronto estará disponible también en versión web para la producción de vídeos, y parece que llegará una versión profesional pensada para estudios y publicidad. Es un buen ejemplo de cómo evoluciona la industria, con productos diferenciados según el sector.
Los feeds basados en IA dan miedo. No negaré que sentí cierta preocupación cuando supe por primera vez que íbamos a lanzar Sora 2.
— John Hallman (@johnohallman) 30 de septiembre de 2025
Dicho esto, creo que el equipo hizo el mejor trabajo posible al diseñar una experiencia positiva. En comparación con otras plataformas, me encuentro desplazándome mucho... https://t.co/uLeeVMKncl
Tinker, más allá de ajustar salidas textuales
Thinking Machines es la empresa fundada por Mira Murati, antigua directiva de OpenAI, valorada en 12.000 millones de dólares y que ha levantado 2.000 millones en una ronda liderada por a16z con inversores como Nvidia, AMD y Cisco. Es una de las startups más vigiladas de Silicon Valley. Su misión es ofrecer productos que permitan a las empresas adaptar los modelos de IA generativa a sus datos, objetivos y formas de trabajo.
Esto es clave en el desarrollo de agentes virtuales, pero también en la generación de propuestas y, en general, para conseguir alinear a todos los actores de una organización. Su primer producto es Tinker, una plataforma para hacer fine-tuning de los modelos. Permite ajustar respuestas tanto con ejemplos concretos como con preferencias generales, y ofrece una librería de alto nivel para simplificar el proceso. Su interés no se limita a ajustar salidas textuales: también abre la puerta a resultados en áreas como matemáticas, química o arquitectura de sistemas. Inicialmente, es compatible con los modelos LLaMA y Qwen.
Apple se retracta del lanzamiento de las Vision Pro Air
Apple ha cancelado el lanzamiento de las Vision Pro Air, una versión más económica de las Vision Pro, para concentrarse en dos nuevos modelos: el N50 (previsto para 2026-2027, sin pantalla) y el N70 (para 2028, con pantalla). Este proyecto tenía que ser la estrella de Tim Cook, pero ahora parece que la empresa queda a remolque de Meta y de las gafas impulsadas por Google Gemini. La lucha por los dispositivos post-smartphone continúa abierta, pero las gafas, que parecían una alternativa clara, ahora se encuentran en un futuro más incierto.
JPMorgan utiliza la IA para interactuar con clientes
Los bancos han empezado a migrar las interacciones con clientes hacia sistemas de IA. En EE. UU., Wells Fargo ya utiliza una IA basada en Google Gemini. JPMorgan, el banco más grande de Estados Unidos, que opera en retail bajo la marca Chase, tiene una inversión de 10.000 millones en OpenAI y ya utiliza IA generativa internamente para proyectos y presentaciones. Ahora, empezará a aplicarla también en la interacción con clientes. Todo apunta a que pronto veremos movimientos similares en Europa y España, con implicaciones muy relevantes para el sector financiero.
La investigación en inteligencia artificial
Qwen3-Next
AI Lab: Alibaba
Los investigadores de Alibaba han rediseñado la arquitectura de su modelo para hacerlo más eficiente en textos muy largos, reduciendo la dependencia del mecanismo clásico de “atención” propio de los LLMs.
Pre-training under infinite compute
AI Lab: Stanford
Analiza cómo entrenar modelos grandes cuando el cálculo no es el límite, pero los datos sí. Con técnicas de regularización más fuertes, ensembling y destilación en modelos más pequeños, consiguen multiplicar por cinco la eficiencia de datos y mejorar también en pruebas prácticas. La conclusión: con ajustes algorítmicos, se puede entrenar mucho mejor con menos datos.
Teaching LLMs to plan
AI Lab: MIT & Microsoft
Los LLMs aún tienen dificultades para hacer planes lógicos y estructurados. El método PDDL-INSTRUCT les enseña a razonar paso a paso y a verificar acciones y planes, consiguiendo hasta un 94% de acierto, muy por encima de los modelos convencionales.
Learn Your Way: Reimaginar los libros de texto con Gen AI
AI Lab: Google Labs
Learn Your Way es un sistema que adapta los libros de texto al nivel y a los intereses de cada alumno, transformándolos en formatos diversos: texto inmersivo, diapositivas narradas, lecciones de audio y mapas mentales con actividades de evaluación. En un estudio con 60 estudiantes, mejoró de manera significativa la retención inmediata y al cabo de tres días en comparación con un lector digital estándar.
Otras noticias
-Meta (FAIR) ha restringido la política de publicación abierta, lo que ha llevado a Yann LeCun a insinuar que podría dejar el cargo.
-DeepSeek ha presentado el modelo V3.2-Exp, que reduce costes un 50% y amplía la ventana de contexto a 128K tókenes gracias al nuevo método DSA (DeepSeek Sparse Attention).
-OpenAI ha anunciado Instant Checkout, con el que los usuarios podrán comprar en Etsy y Shopify y pagar con Apple Pay, Google Pay, Stripe o tarjeta.
-Accenture ha despedido a 11.500 trabajadores y ha advertido que quien no aprenda a usar IA no continuará en la compañía.
-Anthropic ha lanzado Claude AgentSDK, una librería para construir agentes de IA que compite directamente con la de OpenAI.