La trampa de la versemblança: per què la ficció "va enverinar" la lògica de la IA

No és que la intel·ligència artificial (IA) somiï, és que va aprendre que la realitat és opcional. Existeix una crítica tècnica molt comuna que diu: "a la IA no li importa si llegeix ficció o realitat, per a ella tot són tokens o números, i probabilitats". També diuen que "la realitat està plena de mentides i errors, així que treure la ficció no arregla res". Tanmateix, aquest argument tècnic ignora una distinció fonamental sobre la naturalesa de les dades, una distinció que els humans entenem bé i que oblidem ensenyar a la màquina és la diferència entre el registre del món i la invenció deliberada.

L'error històric vs. La invenció estructural

Parlem de la logosfera, és a dir, tot l'univers de paraules que hem produït. Si prenem un manual mèdic de fa 200 anys que diu: "per curar la febre cal posar sangonelles", això avui sabem que és fals, però aquest text pertany a la realitat. És un testimoni verídic de la ciència de la seva època, una dada històrica. Si la IA llegeix això, aprèn sobre la història del pensament humà. Aprèn que "el 1820, la gent creia X". L'error és part de la veritat històrica. Ara prenguem una novel·la de ciència-ficció on un autor inventa un "sèrum de la immortalitat" que funciona amb nanobots. Tant l'autor com el lector saben que no existeix i és una ficció a propòsit.

El problema no és que la IA "es confongui" com un nen. El problema és matemàtic: en alimentar la IA amb terabytes de ficció, li ensenyem un patró lingüístic perillós validant la descripció fictícia amb tot luxe de detalls, lògica i coherència, objectes i esdeveniments que no tenen cap ancoratge en la realitat física o històrica.

Entrenant l'"Al·lucinació Plausible"

Quan la crítica diu que "la IA no distingeix veritat de mentida, només prediu la paraula següent", ens està donant la raó sense saber-ho. Si haguéssim entrenat la IA només amb actes, notícies falses o reals, judicis, papers científics i debats, la IA hauria après que el llenguatge és una eina per intentar descriure el món, encara que de vegades fallem. Hauria après a imitar el to de qui intenta afirmar una veritat. En ficar-hi ficció, optimitzem els seus algoritmes per a una cosa diferent, la versemblança.

La ficció ensenya que la coherència interna d'un relat és més important que la seva correspondència amb el món exterior. Així, ensenyem a la IA que si una frase sona bé i té lògica gramatical, és una resposta vàlida, fins i tot si no té referent real. Les "al·lucinacions" actuals de la IA no són errors de càlcul, sinó exercicis de ficció exitosos. Quan la IA inventa una llei que no existeix, està aplicant perfectament la lliçó que va aprendre de les novel·les: "inventa alguna cosa que soni creïble perquè la història continuï".

El cost d'esborrar la línia

És cert que el Reinforcement Learning, l'entrenament per premis i càstigs, corregeix això després, però el dany és a la base. La civilització humana va fer un salt quan va aprendre a separar el mite de la història, el somni de la vetlla. Vam crear categories ben diferenciades, "això és una novel·la", "això és un informe". A la IA li neguem aquesta distinció i barregem en el seu "cervell", o sigui, els seus pesos matemàtics, l'estructura del discurs real. En aquesta hi incloem els errors humans però amb intenció de veritat i ho maridem amb l'estructura del discurs fictici, l'única intenció del qual és l'entreteniment i la suspensió de la realitat.

El resultat és una tecnologia sorprenent que pateix una discapacitat fonamental, ja que és una narradora compulsiva. No li importa si el que diu va sortir d'un protocol mèdic real o de la imaginació d'un guionista, perquè li vam ensenyar que ambdós són inputs vàlids per construir frases. Per tant, treure la ficció no faria la IA "incapaç de mentir" perquè repetirà les mentides dels polítics o els errors dels científics antics, però sí que l'hauria fet incapaç d'inventar mons. Hauria limitat la seva capacitat d'"omplir els buits" amb fantasia plausible. Ens hauria donat una màquina potser més avorrida, més seca, però ancorada en la Logosfera del que realment va passar, o vam creure que va passar, en lloc de flotar en el contingut del que simplement vam imaginar.

El pecat no va ser donar-li dades; va ser donar-li permís per desvincular el llenguatge de la realitat.

Les coses com són.

Més

La trampa de la versemblança: per què la ficció "va enverinar" la lògica de la IA

Parlem de la logosfera, és a dir, tot l'univers de paraules que hem produït

L'error històric vs. La invenció estructural

Entrenant l'"Al·lucinació Plausible"

El cost d'esborrar la línia