Google ha llançat avui una nova eina d'Intel·ligència Artificial (IA) anomenada Gemini, que ha presentat com més potent que qualsevol altra actualment al mercat, incloent el popular ChatGPT, creat per OpenAI, avui aliada amb Microsoft.

La companyia subratlla la "multimodalitat" de Gemini, a l'ésser capaç de "raonar amb fluïdesa mitjançant textos, imatges, vídeo, àudio i codis", a través de la qual cosa es coneix com el model MMLU, sigles en anglès per a la "comprensió massiva de llenguatge multitasques".

Segons la presentació general oferta avui per la companyia, Gemini es presentarà en tres formats: Nano (la més senzilla, en forma d'aplicació per a telèfons cel·lulars), Pro i Ultra, aquesta última "la més potent per a tasques de gran complexitat".

Gemini pot rebre informació visual o auditiva (notes de música, imatges, paraules) i des d'allà generar contingut propi, que al seu torn pot ser en versió text, àudio o imatges.

En la presentació, Gemini és capaç de detectar errors en un problema matemàtic complex, donar la resposta correcta i explicar els passos fins a arribar a ella; o de donar abundant informació sobre un animal (un ànec) a través d'un simple dibuix, incloent la traducció d'"ànec" a cinc llengües.

Igualment, és capaç de "jugar" amb l'usuari en reptes tan populars com "pedra, paper o tisora" o el dels tres gobelets.

Gemini treballa amb els llenguatges de codi més habituals, com Java, Python, C++ i Go, segons els seus creadors, i encara que incorre en alguns errors, Google dic que els sap resoldre quan així se li comunica en el 90 % dels casos.

El potencial de Gemini s'aplicarà al seu sistema actual de xat, conegut com a Bard i que funciona ja en diverses llengües, inclòs l'espanyol.

La companyia no ha aclarit com pensa monetitzar la nova eina, i de moment s'ha limitat a anunciar que estarà disponible a partir del 13 de desembre.