Gemine 2.5 Deep Think, el nuevo modelo de razonamiento con IA más avanzado de Google

Google acaba de presentar su modelo Gemini más potente, pero probablemente no podrás probarlo. Tras la irrupción de Gemini 2.5 Deep Think en la conferencia I/O de mayo, Google incluye esta IA en la app Gemini. Deep Think está diseñado para las consultas más complejas, lo que significa que utiliza más recursos computacionales que otros modelos. Por lo tanto, no debería sorprender que solo quienes estén suscritos al plan AI Ultra de Google de $250 puedan acceder a él. Deep Think se basa en los mismos principios que Gemini 2.5 Pro, pero aumenta el tiempo de reflexión con un mayor análisis paralelo. Según Google, Deep Think explora múltiples enfoques para un problema, incluso revisando y remezclando las diversas hipótesis que genera. Este proceso le ayuda a generar resultados de mayor calidad.

Avance matemático

Según la compañía, es su modelo de razonamiento de IA más avanzado, capaz de responder preguntas explorando y considerando múltiples ideas simultáneamente y luego usando esos resultados para elegir la mejor respuesta. Los suscriptores a la suscripción Ultra de Google de 250 dólares al mes tendrán acceso a Gemini 2.5 Deep Think en la aplicación Gemini. Google también afirma que Gemini 2.5 Deep Think supera a los modelos de IA de OpenAI, xAI y Anthropic en LiveCodeBench 6, una exigente prueba de programación competitiva. El modelo de Google obtuvo una puntuación del 87,6 %, mientras que Grok 4 obtuvo un 79 % y o3 de OpenAI un 72 %.

Al igual que otras herramientas potentes de Gemini, Deep Think tarda varios minutos en generar una respuesta. Esto, aparentemente, hace que la IA sea más competente en estética de diseño, razonamiento científico y programación. Google ha sometido Deep Think a las pruebas habituales, demostrando que supera a Gemini 2.5 Pro estándar y a modelos de la competencia como OpenAI o3 y Grok 4. Deep Think muestra una mejora especialmente significativa en el Último Examen de la Humanidad, una colección de 2.500 preguntas complejas y multimodales que abarcan más de 100 temas. Otros modelos alcanzan un máximo del 20 o 25 %, pero Gemini 2.5 Deep Think logró una puntuación del 34,8 %. Las matemáticas son un enfoque fundamental de Deep Think, que también demuestra un excelente rendimiento en el benchmark AIME. Sin embargo, aún queda trabajo por hacer. Google reveló recientemente que utilizó una versión especialmente entrenada de Deep Think, capaz de procesar durante horas antes de generar una solución, para competir en la Olimpiada Internacional de Matemáticas (OIM). Este modelo obtuvo una medalla de oro en la OIM por primera vez. Google solo ha distribuido la versión OIM de Deep Think a evaluadores de confianza, pero espera lanzarla más ampliamente más adelante. Mientras tanto, la versión estándar de Deep Think aún alcanza la medalla de bronce en la prueba OIM de 2025.

Más