Gemini 2.5 Deep Think, el nou model de raonament amb IA més avançat de Google

Google acaba de presentar el seu model Gemini més potent, però probablement no podràs provar-ho. Després de la irrupció de Gemini 2.5 Deep Think en la conferència I/O de maig, Google inclou aquesta IA en l'app Gemini. Deep Think està dissenyat per a les consultes més complexes, la qual cosa significa que utilitza més recursos computacionals que altres models. Per tant, no hauria de sorprendre que només els qui estiguin subscrits al pla AI Ultra de Google de $250 puguin accedir a ell. Deep Think es basa en els mateixos principis que Gemini 2.5 Pro, però augmenta el temps de reflexió amb una anàlisi paral·lela més gran. Segons Google, Deep Think explora múltiples enfocaments per a un problema, fins i tot revisant i remesclant les diverses hipòtesis que genera. Aquest procés l'ajuda a generar resultats de més qualitat.

Segons la companyia, és la seva model de raonament d'IA més avançat, capaç de respondre preguntes explorant i considerant múltiples idees simultàniament i després utilitzant aquests resultats per triar la millor resposta. Els subscriptors a la subscripció Ultra de Google de 250 dòlars al mes tindran accés a Gemini 2.5 Deep Think en l'aplicació Gemini. Google també afirma que Gemini 2.5 Deep Think supera als models d'IA de OpenAI, xAI i Anthropic en LiveCodeBench 6, una exigent prova de programació competitiva. El model de Google va obtenir una puntuació del 87,6 %, mentre que Grok 4 va obtenir un 79 % i o3 de OpenAI un 72 %.

Progrés matemàtic

Igual com altres eines potents de Gemini, Deep Think tarda diversos minuts a generar una resposta. Això, aparentment, fa que la IA sigui més competent en estètica de disseny, raonament científic i programació. Google ha sotmès Deep Think a les proves habituals, demostrant que supera Gemini 2.5 Pro estàndard i a models de la competència com OpenAI o3 i Grok 4. Deep Think mostra una millora especialment significativa en l'Últim Examen de la Humanitat, una col·lecció de 2.500 preguntes complexes i multimodals que inclouen més de 100 temes. Altres models assoleixen un màxim del 20 o 25 %, però Gemini 2.5 Deep Think va aconseguir una puntuació del 34,8 %. Les matemàtiques són un enfocament fonamental de Deep Think, que també demostra un excel·lent rendiment en el benchmark AIME. Tanmateix, encara queda treball per fer. Google va revelar recentment que va utilitzar una versió especialment entrenada de Deep Think, capaç de processar durant hores abans de generar una solució, per competir en l'olimpíada Internacional de Matemàtiques (OIM). Aquest model va obtenir una medalla d'or en l'OIM per primera vegada. Google només ha distribuït la versió OIM de Deep Think a avaluadors de confiança, però espera llançar-la més àmpliament més endavant. Mentrestant, la versió estàndard de Deep Think encara assoleix la medalla de bronze en la prova OIM de 2025.

Gemini 2.5 Deep Think, el nou model de raonament amb IA més avançat de Google

Google acaba de presentar el seu model Gemini més potent, però probablement no podràs provar-ho

Progrés matemàtic

Kevin Lee: "Barcelona és de les destinacions europees més atractives per als viatgers asiàtics"

Kevin Lee:
"Barcelona és de les destinacions europees més atractives per als viatgers asiàtics"