Pràcticament, des de l'aparició dels primers bots conversacionals, la intel·ligència artificial ha estat estretament relacionada amb la generació d'imatges. Algunes de les eines més conegudes són DALL-E, MidJourney o Stable Diffusion, que a partir d'un text creen imatges realistes que bé podrien haver estat preses per un fotògraf expert amb una bona càmera fotogràfica.
Tanmateix, els models bàsics d'IA capaces de generar entorns en línia 3D complets i coherents a partir d'un prompt de text no són comuns. De fet, estan començant a sorgir ara. És el que ha portat a Matthias Niessner, un dels investigadors de models 3D d'IA més destacats d'Europa, a fundar la seva empresa emergent SpAItial i prendre un descans del seu laboratori de computació visual i IA a la Universitat Tècnica de Múnic.
Com es pot llegir en el seu lloc web oficial, "SpAItial és pioner en els models de fonaments especials (SFM), un paradigma revolucionari d'IA dissenyat per generar i raonar sobre l'aparença i la física d'entorns reals i imaginaris. A diferència de les tecnologies d'IA generativa existents, els SFM operen de forma nativa en l'espai físic, la qual cosa millora significativament les seves capacitats cognitives, imitant la comprensió humana."
Els SFM prometen revolucionar diversos sectors, des de la creació de mons virtuals immersius per a videojocs i entreteniment fins a la construcció CAD, així com les experiències de realitat virtual i augmentada d'última generació, a part de la robòtica. Pel seu potencial, no és estrany que Niessner hagi recaptat en una ronda de capital llavor uns 11 milions d'euros per posar en marxa SpAItial.
Un sector en el qual (encara) no hi ha tanta competència
Niessner ja sap el que és l'èxit. És el cofundador de Synthesia, una empresa emergent d'avatars realistes creats amb intel·ligència artificial que està valorada en 2.100 milions de dòlars. Pot ser que per això el principal inversor, Earlybird Venture Captial (un destacat inversor europeu en etapes inicials), juntament amb Speedinvest i altres inversors d'alt perfil, hagin apostat pel projecte amb tal quantitat inicial.
No només vull un món 3D. També vull que aquest món es comporti com el món real. Vull que sigui interactiu i que es puguin fer coses en ell, i ningú no ha aconseguit encara
La «confiança cega» amb SpAItial és molt cridanera perquè l'empresa emergent encara no té gaire a ensenyar, més enllà d'un vídeo teaser publicat recentment que mostra com un missatge de text podria generar una habitació 3D. Tanmateix, no és per a menys, ja que a l'equip hi ha gent amb bastant experiència.
Ricardo Martin-Brualla va treballar a la plataforma de teleconferència 3D de Google, ara anomenada Beam. I David Novotny va estar sis anys en Meta dirigint el projecte de generació d'actius de text a 3D de l'empresa matriu de Facebook, Instagram i WhatsApp. Tot el talent que Niessner pugui captar serà benvingut, ja que al sector ja hi ha altres competidors que tracten enfocaments similars, com Odyssey i World Labs.