Sin duda, las grandes protagonistas no solo de la semana, sino probablemente de toda esta etapa, son las salidas a bolsa de las grandes empresas de inteligencia artificial. Esta semana Anthropic ha formalizado de manera confidencial el primer paso hacia su OPV, y también hemos conocido detalles concretos sobre las futuras operaciones de SpaceX y OpenAI.

Hablamos de operaciones de una dimensión extraordinaria. La salida a bolsa de SpaceX podría convertirse en la más grande de la historia, con una valoración alrededor de los 1,7 billones de dólares, una cifra comparable al PIB anual de España. Para ponerlo en perspectiva, la capitalización de la firma Nvidia se sitúa alrededor de los 5,2 o 5,4 billones de dólares, por encima del PIB anual de Alemania, que ronda los 4,7 billones. Es decir, Nvidia vale ya más que una de las grandes economías industriales del mundo.

Estas OPV pueden tener efectos importantes sobre los mercados. Si tienen bitcoins, habrán visto movimientos bruscos estos días, con caídas significativas (más del 15%). No es osado pensar que una parte del capital especulativo e institucional se pueda estar preparando para entrar en estas grandes operaciones, que concentrarán una enorme atención inversora. Pero lo más relevante es que estas salidas a bolsa harán visible un cambio de fondo: la IA está reconfigurando el mapa del poder empresarial global.

Nuevas compañías serán catapultadas, mientras que otras, ya consolidadas, se transformarán profundamente. Parafraseando a Marc Andreessen, si el software se comía el mundo, ahora es la IA quien lo está haciendo. Sorprende, pues, que en algunos debates estratégicos sobre política económica todavía se ignore el papel central de la inteligencia artificial. Necesitamos una política de innovación en IA mucho más ambiciosa, capaz de capturar una parte significativa del nuevo valor que se está creando.

El otro gran momento de la semana ha sido la intervención de Nvidia en el Computex. Jensen Huang ha presentado nuevas piezas de la infraestructura de la IA, pero también una apuesta especialmente relevante: llevar la inteligencia artificial agéntica a los ordenadores personales. La ambición es clara: impulsar el AI PC, un ordenador en el que los agentes de IA no sean una aplicación más, sino una nueva capa central del sistema operativo.

Hasta ahora, Apple había dominado buena parte de la conversación sobre ordenadores personales eficientes y potentes gracias a sus chips M. Pero Nvidia quiere liderar la nueva arquitectura de los PC agentivos, en la que el valor ya no estará solo en el procesador o el sistema operativo tradicional, sino en la capacidad de ejecutar agentes personales y profesionales en local.

También hemos visto anuncios importantes alrededor de los agentes. Entre ellos destaca Sites de OpenAI, una nueva funcionalidad que permite crear webs, dashboards y entornos interactivos dentro de un espacio propio de trabajo. No se trata solo de generar contenido, sino de construir herramientas funcionales que pueden servir para coordinar proyectos, analizar datos o tomar decisiones en equipo. Como siempre, cada semana en IA es una semana llena de cambios y oportunidades. Esta, en particular, deja tres ideas clave.

La primera es que el mapa de las empresas más valiosas del mundo está cambiando. Las OPV harán oficial y visible qué compañías están capturando el valor inmenso que se está generando alrededor de la IA. La segunda es que la IA se está especializando rápidamente: agentes genéricos, agentes verticales, programación, finanzas, marketing, derecho, diseño, ventas y muchos otros ámbitos. La tercera es que la IA ya no es solo conversacional. Es agéntica. Ya no hablamos únicamente de chatbots que responden preguntas, sino de sistemas capaces de actuar sobre el mundo, ejecutar tareas, coordinar herramientas y transformar procesos. Y esto lo cambiará todo.

SpaceX prepara la salida a bolsa más grande de la historia

SpaceX, la empresa espacial de Elon Musk, ha fijado en 135 dólares el precio de sus acciones para la salida a bolsa, lo que situaría la compañía en una valoración de 1,77 billones de dólares. Con esta operación, la firma prevé captar 74.400 millones de dólares y superar el actual récord de Saudi Aramco, que en 2019 debutó en el mercado con una valoración de 1,7 billones y una captación de más de 29.000 millones.

La compañía podría empezar a cotizar en el Nasdaq la próxima semana bajo el símbolo SPCX. A diferencia del procedimiento habitual, SpaceX no ha establecido una horquilla inicial de precios, sino que ha anunciado directamente una cifra cerrada, aunque todavía podría modificarla. La operación es vista como un termómetro para otras grandes salidas a bolsa previstas, especialmente las de empresas de inteligencia artificial como OpenAI y Anthropic, con valoraciones que se acercan al billón de dólares. Según analistas del mercado, la dimensión de estas compañías hace pensar que los récords actuales podrían volver a romperse pronto.

Uno de los grandes beneficiados sería Elon Musk, que controla aproximadamente el 50% de SpaceX. Con el precio fijado para la oferta, su participación tendría un valor superior a los 752.000 millones de dólares. Si las acciones suben con fuerza en los primeros días de cotización, Musk podría convertirse en el primer billonario del mundo. Fundada en 2002, SpaceX ha transformado el sector espacial con cohetes parcialmente reutilizables y con Starlink, su servicio de internet por satélite. La empresa también ha ampliado su perímetro tras adquirir xAI, la compañía de inteligencia artificial de Musk, que a la vez controlaba la red social X.

A pesar de su crecimiento, SpaceX ha revelado recientemente pérdidas de 4.900 millones de dólares el último año, frente a los 791 millones de beneficio registrados en 2024. Los ingresos, sin embargo, crecieron un 33%, hasta los 18.700 millones. La compañía prevé destinar los fondos captados a proyectos de gran escala, como centros de datos de inteligencia artificial en órbita, una fábrica lunar y, a largo plazo, el envío de humanos a Marte.

Nvidia alerta de que la IA será cada vez más cara

Jensen Huang, consejero delegado de Nvidia, aprovechó su intervención en el Computex de Taiwán para presentar nuevas piezas clave de la infraestructura de la inteligencia artificial. Entre los anuncios se encuentra la llegada a producción de los sistemas basados en Vera Rubin, una nueva generación de servidores para "fábricas de IA agentiva", así como DSX, una plataforma de software pensada para diseñar y operar grandes centros de IA, con gestión de simulación, energía y coordinación con proveedores eléctricos.

La compañía también presentó novedades para ordenadores personales, como RTX Spark, un superchip para Windows orientado a agentes personales de IA, y DGX Station for Windows, un sistema de sobremesa para empresas que quieren ejecutar modelos muy grandes en local. Son equipos de alto rendimiento, pero también con precios muy elevados.

Más allá de los productos, el mensaje más relevante fue económico. Huang afirmó que el coste de capital por gigavatio en infraestructuras de IA podría pasar de los 50.000 millones de dólares actuales a cerca de 100.000 millones. Es decir, el hardware de IA no solo no se estaría abaratando, sino que podría ser más caro que nunca.

Esta tendencia refuerza una duda central sobre el negocio de la IA: ¿cómo pueden ser rentables empresas como OpenAI o Anthropic si tienen que pagar primas cada vez más altas a Nvidia, Hynix y el resto de la cadena de semiconductores? Mientras el software de IA se vuelve más competitivo y tiende a abaratarse, la infraestructura necesaria para entrenar y ejecutar modelos continúa concentrada en pocos proveedores con márgenes muy elevados.

Nvidia defiende que la eficiencia mejora porque cada vatio permite generar más tokens y, por lo tanto, más ingresos potenciales. Pero muchos clientes ya sufren hoy el coste de uso de los modelos. Si la capacidad de generar tokens por dólar no crece de manera muy significativa, el modelo económico de la IA continuará siendo difícil de justificar. La conclusión es que la carrera de la IA dependerá de una enorme cantidad de capital durante los próximos años. Y esta factura, de una manera u otra, acabará llegando también a los inversores y a los ahorradores, ya sea a través de fondos indexados, planes de pensiones o una presión inflacionaria derivada del endeudamiento y la inversión masiva en infraestructura tecnológica.

OpenAI Codex–Sites & Plug-ins 

OpenAI ha anunciado una ampliación importante de Codex, su herramienta de inteligencia artificial nacida para ayudar a programadores, pero que cada vez es más utilizada por perfiles no técnicos. Según la compañía, más de cinco millones de personas usan Codex cada semana, y cerca del 20% ya no son desarrolladores, sino analistas, equipos de marketing, operaciones, diseño, investigación, inversión o banca.

La novedad principal es el lanzamiento de conectores específicos por función profesional. Estos plugins agrupan aplicaciones, instrucciones y flujos de trabajo adaptados a diferentes perfiles. OpenAI ha presentado para análisis de datos, producción creativa, ventas, diseño de producto, inversión en renta variable y banca de inversión. En conjunto, integran 62 aplicaciones populares y 110 habilidades.

El objetivo es que Codex pueda conectarse con las herramientas que ya utilizan las empresas y generar materiales concretos: informes, cuadros de mando, prototipos, presentaciones comerciales, análisis de inversión o planes de seguimiento de clientes. OpenAI afirma que equipos de empresas como Zapier o NVIDIA ya lo usan para acelerar tareas internas y flujos de trabajo complejos.

Otra novedad son los Sites, webs y aplicaciones interactivas que Codex puede crear y compartir dentro de un espacio de trabajo. Pueden servir como tableros de proyecto, planificadores, hubs de lanzamiento, galerías o herramientas ligeras para tomar decisiones en equipo. La función se encuentra en fase de prueba para clientes Business y Enterprise.

OpenAI también amplía las anotaciones, que permiten marcar una parte concreta de un documento, una diapositiva, una hoja de cálculo o una web generada por Codex y pedir cambios precisos. Esto convierte la herramienta en un sistema más útil para iterar sobre borradores, no solo para generar una primera versión.

Con este movimiento, OpenAI busca llevar Codex más allá del desarrollo de software y convertirlo en una plataforma de trabajo transversal para empresas. La compañía también prepara nuevos conectores para finanzas corporativas, capital privado, estrategia de marketing, consultoría y ámbito legal.

Anthropic da el primer paso para salir a bolsa

Anthropic, una de las principales empresas de inteligencia artificial generativa, ha presentado de manera confidencial la documentación inicial ante la Comisión de Bolsa y Valores de Estados Unidos para preparar una posible salida a bolsa. Este tipo de registro permite iniciar el proceso de OPV sin hacer públicas todavía los datos financieros, el número de acciones, la valoración objetivo ni la fecha prevista de cotización. La compañía, creadora de Claude y Claude Code, se ha convertido en una de las firmas de IA de más rápido crecimiento, impulsada por la demanda de herramientas empresariales y por el apoyo financiero de grandes inversores como Amazon y Google.

La posible salida a bolsa daría a Anthropic más capital para competir en una carrera cada vez más cara, marcada por la necesidad de desarrollar modelos avanzados, construir centros de datos y asegurar capacidad de computación. En este contexto, la operación podría convertirse en una de las cotizaciones tecnológicas más observadas de la década.

El movimiento también simboliza un cambio de fase en la industria de la IA. Después de años de crecimiento financiado por capital riesgo, las grandes empresas del sector empiezan a prepararse para el escrutinio de los mercados públicos, donde los inversores no solo valorarán la innovación, sino también los ingresos, la rentabilidad y la capacidad de ejecutar a gran escala.

Trump impulsa una orden ejecutiva para reforzar la IA y la ciberseguridad

La Casa Blanca ha publicado una orden ejecutiva para promover la innovación en inteligencia artificial avanzada y reforzar la seguridad de los sistemas públicos y privados de Estados Unidos. El texto defiende una política favorable al desarrollo de la IA, con menos carga reguladora y una colaboración más estrecha con el sector privado.

La orden establece que varias agencias federales deberán acelerar la protección cibernética de los sistemas de seguridad nacional, de la administración civil y de infraestructuras críticas. También prevé facilitar el acceso a herramientas defensivas basadas en IA para administraciones estatales y locales, hospitales rurales, bancos comunitarios y servicios públicos esenciales.

Una de las medidas centrales es la creación de un centro de coordinación en ciberseguridad con IA, impulsado por el Departamento del Tesoro en colaboración con organismos de seguridad y con la industria. Este mecanismo deberá coordinar la detección de vulnerabilidades, validar riesgos y priorizar la distribución de parches de seguridad.

La orden también plantea un sistema voluntario para que los desarrolladores de modelos avanzados de IA puedan colaborar con el gobierno antes de lanzar determinados modelos al mercado. El objetivo es evaluar sus capacidades en ciberseguridad y facilitar su uso seguro en infraestructuras críticas, sin crear un régimen obligatorio de licencias o autorizaciones previas.

Finalmente, el texto pide priorizar la aplicación de las leyes federales contra actores criminales que utilicen IA para acceder ilegalmente a sistemas informáticos, dañar ordenadores u obtener datos con fines delictivos. La lectura política es clara: la administración Trump quiere presentar la IA como un activo estratégico de seguridad nacional y competitividad económica. El mensaje combina desregulación, apoyo a la industria y una apuesta por utilizar modelos avanzados como herramienta defensiva ante amenazas cibernéticas.

Microsoft presenta siete nuevos modelos propios de inteligencia artificial

Microsoft ha presentado siete nuevos modelos de inteligencia artificial desarrollados por su equipo MAI Superintelligence, en uno de los pasos más claros de la compañía para construir tecnología propia más allá de su alianza con OpenAI. Entre las novedades destaca MAI-Thinking-1, un modelo de razonamiento creado desde cero para resolver tareas complejas y apoyar el desarrollo de software. La compañía también ha anunciado MAI-Image-2.5 y MAI-Image-2.5e, orientados a la generación y edición de imágenes, así como MAI-Voice-2, con nuevas capacidades de voz expresiva y soporte para 15 idiomas adicionales.

Microsoft también ha presentado MAI-Transcribe-1.5, pensado para mejorar la velocidad y la precisión de la transcripción de voz, y MAI-Code-1-Flash, un modelo de programación eficiente integrado en GitHub Copilot y Visual Studio Code. Los nuevos modelos han sido desarrollados por el equipo liderado por Mustafa Suleyman, cofundador de DeepMind e Inflection AI. Estarán disponibles a través de Microsoft Foundry, Azure AI, GitHub Copilot y los productos Copilot de la compañía. El movimiento refuerza la idea de que Microsoft quiere construir una cartera completa de IA propia en texto, voz, imagen, código y razonamiento. La compañía continúa siendo el principal socio de OpenAI, pero cada vez actúa más como un desarrollador de modelos avanzados por derecho propio.

Meta quiere que sus agentes de IA gestionen empresas enteras

Meta ha lanzado un nuevo agente de inteligencia artificial para empresas que funcionará en WhatsApp, Instagram y Messenger en todo el mundo. La herramienta podrá responder preguntas de clientes, reservar citas y cerrar ventas, entre otras funciones. En una fase posterior, la compañía prevé que también pueda hacer estudios de mercado, obtener información sobre competidores y conectarse con herramientas de gestión de calendarios.

Mark Zuckerberg, consejero delegado de Meta, ha presentado el producto como un paso hacia agentes cada vez más autónomos, capaces de ayudar a gestionar un negocio completo. La iniciativa forma parte de la estrategia de Meta para ir más allá de su negocio tradicional, basado sobre todo en la publicidad dirigida a consumidores, y avanzar hacia servicios de suscripción y soluciones para empresas.

El agente será gratuito inicialmente, pero Meta prevé convertirlo en los próximos meses en un servicio de pago con diferentes niveles según el tamaño del negocio. La compañía también lanzará una plataforma separada para grandes empresas que ya utilizan WhatsApp en sus operaciones, con un modelo de facturación basado en el uso.

Según Meta, más de 200 millones de pequeñas empresas usan WhatsApp, y un millón ya han probado el agente en una fase limitada. La compañía también afirma que sus servicios de mensajería de pago en WhatsApp ya generan un ritmo anual de ingresos de 2.000 millones de dólares.

El movimiento llega en un momento en que Meta está incrementando fuertemente su gasto en infraestructura de inteligencia artificial, con una inversión prevista de hasta 145.000 millones de dólares este año. Esta apuesta ha generado inquietud entre algunos inversores, sobre todo después de que la compañía anunciara más gasto en centros de datos.

Aunque el negocio publicitario de Meta sigue creciendo, la compañía busca nuevas vías de ingresos. Zuckerberg ha llegado a plantear la posibilidad de entrar en el negocio de la nube si Meta acaba disponiendo de más capacidad de computación de la que necesita internamente. Mientras tanto, la empresa también ha anunciado nuevas suscripciones para Instagram, Facebook y WhatsApp, y está probando suscripciones para su chatbot de inteligencia artificial.

El objetivo final de Meta es crear agentes para sus 3.500 millones de usuarios diarios, tanto en el ámbito personal como empresarial. Zuckerberg defiende que estas herramientas podrían facilitar una nueva ola de emprendimiento, lo que permite a más personas crear productos y servicios que hasta ahora no tenían los medios para desarrollar.

China entrena el futuro de los robots, de camisa en camisa plegada

Las empresas tecnológicas chinas están movilizando a miles de personas para recoger datos de movimientos humanos en hogares, fábricas y espacios de trabajo. El objetivo es entrenar robots capaces de actuar en entornos reales, más allá de los laboratorios.

El desarrollo de robots humanoides está limitado por la falta de datos que combinen visión, movimiento e interacción con objetos cotidianos. En China, los costes laborales más bajos, el apoyo público y el interés social por la robótica permiten generar grandes volúmenes de datos locales. Esto podría dar al país una ventaja frente a Estados Unidos, donde muchas empresas externalizan esta recogida a países con salarios más bajos.

Algunas compañías ya envían robots a domicilios particulares para observar tareas domésticas, mientras que gigantes como JD.com han impulsado proyectos para grabar millones de horas de trabajos cotidianos. En Suqian, residentes, trabajadores de un centro de personas mayores y empleados agrícolas registran movimientos con cámaras en la cabeza. En Guangdong, fábricas de electrónica y embalaje también colaboran en la recogida de datos mediante cámaras y sensores de muñeca.

Sin embargo, todavía no está claro que acumular vídeos y movimientos humanos sea suficiente para crear robots realmente inteligentes. La industria intenta aplicar a la robótica la misma lógica de escala que impulsó los grandes modelos de lenguaje, pero esta hipótesis sigue pendiente de demostrarse.

Mientras tanto, la nueva economía de los datos robóticos ya genera empleo. Personas como una madre de familia de Shandong cobran por grabarse mientras cocinan, limpian o hacen la colada: tareas cotidianas que ahora se convierten en materia prima para el futuro de la inteligencia artificial física.

La IA supera a profesores de derecho en un estudio de Stanford

Un estudio de la Stanford Law School concluye que profesores de derecho prefirieron de manera clara respuestas generadas por inteligencia artificial a preguntas de estudiantes antes que respuestas escritas por otros profesores. En cerca de 3.000 comparaciones a ciegas, las respuestas de IA fueron escogidas en el 75% de los casos.

La investigación, titulada Law Professors Prefer AI Over Peer Answers, contó con 16 profesores de derecho contractual de diversas universidades norteamericanas. Los participantes redactaron preguntas representativas de las que los estudiantes suelen plantear después de clase o en tutorías, escribieron sus propias respuestas y después evaluaron, sin saber el origen, textos generados por IA y textos de otros profesores.

El resultado es especialmente relevante porque el derecho no es un ámbito de respuestas únicas. A menudo exige interpretar argumentos opuestos, aplicar criterios a situaciones ambiguas y explicar conceptos complejos de manera pedagógica. Según los autores, los modelos de IA demostraron capacidad para cumplir este estándar profesional.

El estudio también apunta que los profesores marcaron las respuestas de IA como potencialmente confusas o perjudiciales solo en un 3,5% de los casos, frente al 12% de las respuestas escritas por otros docentes. Sin embargo, los investigadores evitan defender una adopción masiva e inmediata de estos tutores artificiales.

La conclusión es más matizada: la pregunta ya no es solo si la IA puede dar respuestas jurídicas de calidad, sino cómo integrarla de manera responsable en la educación legal. Bien utilizada, podría ampliar el acceso a explicaciones expertas y complementar el trabajo de los profesores, sin sustituir el juicio crítico que continúa siendo central en la formación de los futuros juristas.

MiniMax M3 refuerza el avance chino en modelos de IA eficientes

La compañía china MiniMax ha presentado M3, un nuevo modelo de inteligencia artificial que, según sus pruebas, compite con algunos de los sistemas más avanzados de Estados Unidos, como Opus o GPT-5.5. Lo más destacable es que lo hace con un tamaño muy inferior y con una ventana de contexto de un millón de tokens, lo que lo sitúa como un modelo especialmente eficiente.

La clave estaría en la manera como los laboratorios chinos gestionan el contexto. A diferencia de muchos modelos occidentales, que mantienen en memoria toda la información recibida, M3 aplica mecanismos de compresión para priorizar aquello que considera más relevante. Es una estrategia inspirada, en parte, en la memoria humana: no recordamos todos los detalles, sino aquellos que el cerebro interpreta como importantes.

Esta compresión permite reducir costes computacionales, un factor crucial para los laboratorios chinos, más limitados en acceso a chips y capacidad de cálculo. MiniMax afirma que su sistema es, además, consciente del hardware y optimiza cómo recupera la información dentro de la memoria de los procesadores gráficos.

Sin embargo, todavía es pronto para decir que M3 sea realmente el estado del arte. La compresión tiene un coste: si el modelo descarta información que después resulta necesaria, el rendimiento puede verse afectado. Los grandes laboratorios norteamericanos evitan a menudo estos mecanismos porque disponen de más recursos para mantener contextos completos.

La lectura más prudente es que los modelos chinos no han encontrado una fórmula mágica, pero sí una vía muy competitiva en rendimiento por coste. Y esto puede ser decisivo: aunque no superen los mejores modelos occidentales en capacidad absoluta, podrían convertirse en alternativas de gran valor para empresas que buscan reducir gasto en inteligencia artificial.

Cómo la IA nos cambiará la vida

Robotaxis aterrizan en Madrid 
Uber traerá robotaxis a Madrid y ya han aterrizado. Son los de WeRide, de esta manera se convertirá en la primera ciudad de España con robotaxis.

Robots que le hacen la competencia a Kilian Jornet
Deep Robotics ha presentado unos nuevos modelos de robots humanoides que son capaces de correr por la montaña

La Investigación IA 

Recursion is the new scaling law-AI Lab: The Sequence
Durante años, el progreso en inteligencia artificial ha seguido una fórmula aparentemente simple: modelos más grandes, más datos y más capacidad de cálculo. Pero algunos de los avances más recientes apuntan hacia otra dirección: sistemas capaces de revisar, probar, corregir y mejorar sus propias respuestas de manera iterativa.

Esta idea sitúa la recursividad como una posible nueva ley de escalado. Ya no se trata solo de que un modelo genere una respuesta en un solo paso, sino que pueda volver sobre el problema, actualizar el contexto, usar herramientas, ejecutar pruebas y decidir si hay que continuar. En este nuevo paradigma, la inteligencia no reside solo en los pesos del modelo, sino también en el bucle que organiza el proceso.

La paradoja es que la IA ya había pasado por aquí. Antes de los transformers, las redes recurrentes dominaban el procesamiento del lenguaje, pero perdieron terreno porque eran difíciles de paralelizar y escalaban mal con el hardware moderno. Los Transformers eliminaron esta recurrencia interna, pero la reconstruyeron a escala de sistema: cada token generado modifica el contexto y condiciona el siguiente paso.

Ahora, esta lógica reaparece en modelos que pueden "pensar más tiempo", en agentes que observan, actúan y corrigen, y en sistemas de investigación que formulan hipótesis, ejecutan experimentos y aprenden de los resultados. En este marco, un agente no es solo un modelo que responde, sino una máquina recursiva con memoria externa: ficheros, navegadores, bases de datos, código, herramientas de verificación y entornos de ejecución.

El reto principal ya no es solo generar respuestas, sino evaluarlas. Un bucle mal diseñado puede amplificar errores, reforzar premisas falsas o producir conclusiones muy pulidas pero equivocadas. Por eso, la calidad de los sistemas recursivos dependerá de buenos mecanismos de verificación, criterios de parada y memoria fiable.

La próxima generación de IA podría no ser simplemente un transformer más grande, sino una arquitectura de bucles: modelos, herramientas, memoria, evaluadores y tiempo trabajando juntos. La pregunta clave dejará de ser solo cuántos parámetros tiene un modelo, y pasará a ser hasta qué punto sabe volver sobre un problema, conservar lo que importa, probar su propio trabajo y detenerse cuando la respuesta es lo suficientemente buena.

Recent Developments in LLM Architectures: KV Sharing, mHC, and Compressed Attention-AI Lab: Sebastian Raschka

Los modelos de lenguaje más recientes están incorporando cambios arquitectónicos para hacer más eficiente el trabajo con contextos largos, una necesidad creciente a medida que los sistemas de razonamiento y los agentes mantienen más información activa durante más tiempo. El reto principal es reducir el coste de la atención, la memoria y el tamaño de la memoria caché de los modelos.

Varias familias de modelos abiertos muestran esta tendencia. Gemma 4 reutiliza información clave entre capas para reducir la memoria necesaria y añade embeddings específicos por capa para ganar capacidad sin hacer crecer demasiado el coste de cálculo. Laguna XS.2 ajusta el presupuesto de atención según la capa, combinando capas locales más baratas con algunas globales más costosas.

Otros modelos apuestan por formas más agresivas de compresión. ZAYA1-8B introduce una atención comprimida en espacio latente, que permite reducir tanto la memoria como el cálculo. DeepSeek V4, por su parte, combina mecanismos de compresión del contexto con conexiones residuales más sofisticadas para mantener rendimiento en ventanas de hasta un millón de tokens con menos coste.

La idea común es clara: los transformers continúan siendo la arquitectura dominante, pero cada vez acumulan más modificaciones internas para hacerlos viables en escenarios de uso intensivo. No se trata tanto de sustituir el transformer como de optimizar piezas concretas: la atención, la memoria caché, las conexiones residuales y la distribución del cálculo.

Esta evolución también hace que los modelos sean más complejos de entender e implementar. El bloque transformer básico continúa en el centro, pero el código de los modelos modernos incorpora cada vez más trucos de eficiencia. La dirección de fondo es que el progreso en IA ya no depende solo de modelos más grandes, sino también de hacer que cada token, cada capa y cada acceso a memoria sean más eficientes.

Otras noticias

-Ya hay más tráfico de agentes artificiales que de humanos en la red.

-Un modelo multimodal de Google que te cabe en el PC – Gemma 4 12B. 

-Anthropic expande Glasswing – el círculo de organizaciones que pueden acceder a Mythos por ciberseguridad – a 150 organizaciones más. 
-Meta ha limitado su herramienta de trazabilidad de los empleados, después de las duras críticas negativas. 
-Microsoft lanza agentes inspirados en OpenClaw. 
-OpenAI anuncia que pronto combinará Codex y ChatGPT. 
-Microsoft ha desarrollado Solara, una plataforma que opera agentes en vez de apps.