No es que la inteligencia artificial (IA) sueñe, es que aprendió que la realidad es opcional. Existe una crítica técnica muy común que dice: "a la IA no le importa si lee ficción o realidad, para ella todo son tokens o números, y probabilidades". También dicen que "la realidad está llena de mentiras y errores, así que quitar la ficción no arregla nada". Sin embargo, este argumento técnico ignora una distinción fundamental sobre la naturaleza de los datos, una distinción que los humanos entendemos bien y que olvidamos enseñar a la máquina es la diferencia entre el registro del mundo y la invención deliberada.
El error histórico vs. La invención estructural
Hablemos de la logosfera, es decir, todo el universo de palabras que hemos producido. Si tomamos un manual médico de hace 200 años que dice: "para curar la fiebre hay que poner sanguijuelas", eso hoy sabemos que es falso, pero ese texto pertenece a la realidad. Es un testimonio verídico de la ciencia de su época, un dato histórico. Si la IA lee eso, aprende sobre la historia del pensamiento humano. Aprende que "en 1820, la gente creía X". El error es parte de la verdad histórica. Ahora tomemos una novela de ciencia ficción donde un autor inventa un "suero de la inmortalidad" que funciona con nanobots. Tanto el autor como el lector saben que no existe y es una ficción adrede.
El problema no es que la IA "se confunda" como un niño. El problema es matemático: al alimentar a la IA con terabytes de ficción, le enseñamos un patrón lingüístico peligroso validando la descripción ficticia con todo lujo de detalles, lógica y coherencia, objetos y eventos que no tienen ningún anclaje en la realidad física o histórica.
Entrenando la "Alucinación Plausible"
Cuando la crítica dice que "la IA no distingue verdad de mentira, solo predice la siguiente palabra", nos está dando la razón sin saberlo. Si hubiéramos entrenado a la IA solo con actas, noticias falsas o reales, juicios, papers científicos y debates, la IA habría aprendido que el lenguaje es una herramienta para intentar describir el mundo, aunque a veces fallemos. Habría aprendido a imitar el tono de quien intenta afirmar una verdad. Al meterle ficción, optimizamos sus algoritmos para algo distinto, la verosimilitud.
La ficción enseña que la coherencia interna de un relato es más importante que su correspondencia con el mundo exterior. Así, le enseñamos a la IA que si una frase suena bien y tiene lógica gramatical, es una respuesta válida, incluso si no tiene referente real. Las "alucinaciones" actuales de la IA no son errores de cálculo, sino ejercicios de ficción exitosos. Cuando la IA inventa una ley que no existe, está aplicando perfectamente la lección que aprendió de las novelas: "inventa algo que suene creíble para que la historia continúe".
El costo de borrar la línea
Es cierto que el Reinforcement Learning, el entrenamiento por premios y castigos, corrige esto después, pero el daño está en la base. La civilización humana dio un salto cuando aprendió a separar el mito de la historia, el sueño de la vigilia. Creamos categorías distintas, "esto es una novela", "esto es un informe". A la IA le negamos esa distinción y mezclamos en su "cerebro", o sea, sus pesos matemáticos, la estructura del discurso real. En esta incluimos los errores humanos pero con intención de verdad y lo maridamos con la estructura del discurso ficticio, cuya única intención es el entretenimiento y la suspensión de la realidad.
El resultado es una tecnología asombrosa que sufre de una discapacidad fundamental, ya que es una narradora compulsiva. No le importa si lo que dice salió de un protocolo médico real o de la imaginación de un guionista, porque le enseñamos que ambos son insumos válidos para construir oraciones. Por lo tanto, quitar la ficción no haría a la IA "incapaz de mentir" porque repetirá las mentiras de los políticos o los errores de los científicos antiguos, pero sí la habría hecho incapaz de inventar mundos. Habría limitado su capacidad de "rellenar los huecos" con fantasía plausible. Nos habría dado una máquina quizás más aburrida, más seca, pero anclada en la Logosfera de lo que realmente ocurrió, o creímos que ocurrió, en lugar de flotar en el contenido de lo que simplemente imaginamos.
El pecado no fue darle datos; fue darle permiso para desvincular el lenguaje de la realidad.
Las cosas como son.