¿Sabes que ya una  IA no solo puede ver imágenes, sino que también puede razonar a partir de éstas? Hoy te voy a contar cómo OpenAI, ha lanzado dos nuevos modelos de inteligencia artificial, o3 y o4-mini, con mayores capacidades de razonamiento, visuales y autónomas. Soy Esther Checa, y en los próximos minutos te explicaré por qué estos modelos son relevantes, ya que  no solamente procesan texto, sino que razonan, usan herramientas de forma autónoma, comprenden imágenes en profundidad, e incluso generan nuevas ideas en el campo, la ciencia.

Descubre los dos modelos

El modelo de inteligencia o3 es el más avanzado que han creado hasta ahora en palabras de OpenAI. Está diseñado para resolver problemas complejos que requieren razonamiento profundo: desde matemáticas avanzadas hasta analizar imágenes o generar ideas nuevas. Es como tener un asistente que no solo ejecuta tareas, sino que también colabora contigo, te hace preguntas de forma proactiva  y te propone soluciones.

Por otro lado, o4-mini es su versión más ligera, pero igualmente potente. Es más rápido y eficiente, ideal para tareas como el análisis de datos o la programación, sin perder esa capacidad de razonamiento profundo. Estos modelos pueden usar herramientas por sí solos. Ellos deciden cuándo abrir un navegador, usar un lenguaje de programación como Python, o generar imágenes como parte de su razonamiento. No necesitan que se lo digas: simplemente lo hacen cuando lo consideran útil. Además, tienen una nueva habilidad: "piensan con imágenes". No solo entienden lo que hay en una foto, sino que la integran en su forma de resolver problemas. Esto permite nuevas aplicaciones donde la lógica y lo visual se combinan, algo que hasta ahora era impensable.

Codex CLI, nuevo asistente

Y si eres desarrollador, esto te interesa: OpenAI también ha lanzado Codex CLI, un asistente que se conecta directamente a tu terminal. Te ayuda a programar, corregir errores o entender código en tiempo real. La importancia de estos avances radica en que ya no hablamos de modelos que simplemente reaccionan al input del usuario, sino que son sistemas que observan, eligen y actúan de forma proactiva. Con capacidades como memoria, razonamiento multimodal, y uso autónomo de herramientas, parece que estamos frente a sistemas con estructura similar a lo que se conoce como inteligencia artificial general.

Pese a proclamarse como los mejores modelos con capacidades para pensar con intención, actuar con autonomía y comprender el mundo de forma más parecida a como lo haría un ser humano, es Google quien sigue liderando la mejor relación calidad-precio de los modelos según expertos de la industria, es decir, los modelos de Google ofrecen la mejor inteligencia artificial por dólar a día de hoy.