El camí cap a una intel·ligència artificial (IA) capaç d'operar amb autonomia total en guerra exigeix una arquitectura modular. Aquesta no s'assembla a un model estadístic entrenat amb milions d'exemples, sinó que s'assembla a un organisme compost per parts especialitzades. I cada component compleix una funció definida, alhora que interactuen per produir decisions coherents, fins i tot quan l'entorn canvia i les dades es tornen sorolloses.

El primer mòdul seria un model de món que manté una representació interna de l'entorn. No és un mapa estàtic, sinó una simulació en miniatura que prediu moviments, calcula canvis en el clima, anticipa maniobres enemigues i avalua senyals sospitosos. El model compara constantment les seves prediccions amb els registres dels sensors. Si hi ha discrepàncies repetides, interpreta que l'entorn va canviar i aquesta detecció és fonamental perquè indica risc operatiu. La màquina necessita saber quan les condicions van deixar d'encaixar amb la seva base interna. Però els sistemes actuals no fan aquesta comparació profunda. Només processen senyals i entreguen classificacions.

El segon mòdul seria la percepció explicativa. Una càmera normal recull imatges i un model estadístic assenyala que una figura s'assembla a un tanc. Una percepció explicativa necessita agrupar diversos senyals i produir causes possibles. Per exemple, calor alta, vibració baixa i soroll electrònic poden indicar un vehicle encès en repòs. Un senyal tèrmic sense vibració pot indicar una trampa tèrmica. Per a això es necessita un sistema de grafs causals, on cada senyal es vincula amb una causa probable. Investigacions de Stanford i Facebook AI Research exploren aquests grafs. Per la seva banda, Palantir usa grafs en intel·ligència militar. Ningú va construir encara un model de percepció que raoni en temps real dins d'un entorn dinàmic.

El mòdul de simulació interna executa escenaris futurs. Si la màquina pensa que un senyal és autèntic, calcula què hauria de passar en els pròxims segons. Si passen coses diferents, la màquina descarta aquesta hipòtesi i en prova una altra. Aquesta capacitat d'autoavaluació requereix cicles ràpids de simulació i comparació. Lockheed Martin treballa amb bessons digitals d'aeronaus completes i DeepMind investiga simulacions automàtiques en jocs complexos. Anduril experimenta amb cicles d'autoavaluació per a drons. Totes aquestes són peces parcials d'alguna cosa més gran que encara no existeix.

La IA actual resol tasques concretes amb una eficiència alta, però no resol tasques complexes amb incertesa extrema i senyals distorsionats

Per sobre de tot això apareix un planificador explícit que necessita calcular rutes, moviments, canvis d'altitud, maniobres evasives i priorització d'objectius. Aquest no pren decisions basades en el que va funcionar abans, sinó en l'estat actual del model intern i de les simulacions futures. S'assembla a un sistema que analitza diversos camins possibles i selecciona el que encaixa millor amb la seva imatge de l'entorn.

L'arquitectura nova també requereix una capa simbòlica, amb regles dures. Aquestes fixen accions permeses i prohibides d'acord amb l'estructura de la missió. Una màquina no pot improvisar en zones on el risc tàctic és alt sense revisar primer aquesta instància. La capa simbòlica es programa i es verifica matemàticament. Indústries com l'aeroespacial ja tenen dècades d'experiència en verificació formal de programari per a sistemes crítics.

La màquina també necessita aprendre de forma adversària. Un mòdul d'autoavaluació genera amenaces i crea escenaris problemàtics, alhora que un altre mòdul intenta resoldre'ls. Aquest procés es repeteix fins a reduir falles internes. DeepMind fa servir aquesta tècnica en jocs amb resultats cridaners. DARPA finança programes que fan servir adversaris automàtics per millorar sistemes militars. Això encara no s'ha integrat en un sistema autònom de combat

Finalment, es necessita maquinari específic per a cada mòdul. Un processador a base de GPU no serveix per a tot. La percepció requereix maquinari neuromòrfic com el que desenvolupen SynSense o Intel amb Loihi. La simulació demana maquinari amb paral·lelisme massiu com el de Cerebras o Graphcore. El planificador exigeix processadors configurables com els FPGA de Xilinx. La capa simbòlica necessita microcontroladors verificats. El model de món precisa memòria ràpida i processadors dedicats a càlculs físics. Cap fabricant produeix avui un conjunt integrat de maquinari per a aquesta arquitectura

Empreses com Anduril avancen en la integració de sensors, simulació, lògica simbòlica i models estadístics en un únic sistema, si bé encara en etapes inicials. Lockheed Martin aporta simulació profunda i fusió sensorial. DeepMind impulsa tècniques de planificació i raonament. Palantir unifica grafs per a anàlisi d'intel·ligència. Mentrestant, Hailo produeix xips de baix consum. No obstant això, cap companyia té l'arquitectura completa. Totes aporten peces que podrien acoblar-se en un futur

L'autonomia total necessita que totes aquestes parts funcionin juntes. La IA actual resol tasques concretes amb eficiència alta, però no resol tasques complexes amb incertesa extrema i senyals distorsionades. El desenvolupament d'una arquitectura nova permetrà a una màquina capaç d'interpretar, simular, actualitzar hipòtesis i actuar en entorns dinàmics sense dependre de patrons previs. Aquest tipus d'intel·ligència encara no està construït.

Les coses com són.