Imaginem per un moment que tota la informació que hi ha al món fora un gran oceà desordenat de paraules, això inclou llibres, articles, papers científics, enciclopèdies, lleis, publicacions en xarxes socials, blogs, tutorials, programes d'ordinador. Està ple de coses útils, però també té escombraries flotant. Inclou textos boníssims i altres d'equivocats. Hi ha idees ben explicades i hi ha conceptes mal exposats. Hi ha coses repetides mil vegades i hi ha silencis en temes importants. Les intel·ligències artificials que utilitzem avui, com ChatGPT, Claude o Gemini, van ser entrenats nedant en aquest oceà. Van llegir tot el que van poder i van aprendre a parlar, a explicar, a respondre preguntes. Però ningú no va netejar aquest oceà, i van aprendre entre la brutícia.
La potència de Grok
El que proposa Elon Musk és una mica radicalment diferent, va plantejar l'ús d'una intel·ligència artificial (IA) molt potent —la nova versió de Grok, que ell en crida 3.5 o potser ja 4, i fer-la servir per llegir aquest oceà sencer, però no per entrenar-se. Primer, llegir per corregir, ordenar i reescriure. No com un lloro que repeteix el que veu, sinó com un editor que entén, compara i millora. Grok llegirà un article de Viquipèdia i notarà que en una part es diu que una espècie d'au va desaparèixer el 2017, però en un altre costat hi ha registres d'aquesta au el 2019. Detectarà aquesta contradicció i investigarà quin estudi és més confiable, quina font està més actualitzada. I després escriurà una versió nova, corregida, que reflecteixi millor la realitat. Farà el mateix amb conceptes científics, amb definicions tècniques, amb explicacions històriques, amb receptes, amb tot. Completarà el que falta, a aclarir el que està confús, a llençar a les escombraries el que no serveix.
El resultat d'aquest procés seria un nou corpus, una nova base de coneixement. Alguna cosa així com una biblioteca gegant escrita des de zero per una IA que ja va entendre el contingut, el va depurar, el va filtrar i el va reordenar. No és que copiarà i enganxarà paràgrafs. No és una barreja de coses que ja existeixen. És un text nou, que conserva el millor de l'anterior, però sense els errors, sense les repeticions, ni les incoherències. I llavors, tot just allà, amb aquesta biblioteca acabada, Musk vol entrenar un nou model d'IA des de zero. No utilitzarà els models anteriors ni les mateixes bases de dades que utilitzen avui les grans companyies, començarà de nou, amb dades netes. L'objectiu és evitar el problema que avui afecta a gairebé tots els models: que van ser entrenats amb informació contaminada amb mentides, errors, perjudicis i llenguatge mal construït. Si un entrena una IA amb informació sense correccions, aquesta intel·ligència repeteix els errors que va llegir. Però si primer la IA revisa tot i després entrena a una altra IA amb aquest material, llavors sí, el nou model tindrà una comprensió més clara, més lògica i profunda.
El raonament abans que res
La idea és que sigui una màquina que entén, raona i no arrossega la confusió del passat. Això no existeix avui, ja que tots entrenen amb el que troben. I Musk vol canviar això de soca-rel. Ara bé, aquesta idea també desperta preguntes que molts no volen enfrontar. Perquè si es pot reescriure tot el coneixement humà, també es pot reescriure sense certes coses. I llavors comencen les comandes: "Amb aquest corpus nou, si us plau treu els textos amb drets d'autor". "Elimina el que contradigui la meva religió". "Descarta les fonts anònimes". "Omet el que tingui llenguatge ofensiu per al meu grup". "Suprimeix el que va ser escrit abans de l'any 2000". Cada un amb la seva exigència. Cada un volent que el seu filtre s'apliqui. El que avui és un oceà, amb tot agitat, pot tornar-se un aquari controlat, amb peixos elegits a dit, i el problema no és a la màquina. El problema és que aquesta tecnologia, per primera vegada, permet fer el que abans era impossible: refer tot des de zero. I en aquell moment, tots voldran decidir què entra i què queda fora. Aquest és el veritable risc. Les coses com són.