La revolució silenciosa d'AlphaEvolve: el codi que escriu codi

Imaginem que tens un grup de nens en una plaça. Un vol aprendre a fer malabars. No sap res, ni per on començar. Intenta llançar tres pilotes, li cauen. Prova una altra vegada, canvia una cosa, li cauen de nou. Mira a un altre nen, còpia, assaja. Intenta, fins que un dia completa tres moviments seguits sense que li caiguin. Aprèn. Però no només això: imagina que aquest nen també pren nota de tot el que va provar abans. I quan alguna cosa no va funcionar, l'anota per no repetir-ho. I si alguna cosa va funcionar més o menys, ho millora. Això és, en essència, el que fa AlphaEvolve: un sistema que prova, aprèn, anota, millora, torna a intentar... però en comptes de malabars, treballa amb programes d'ordinador.

Una aposta de Google

AlphaEvolve és un sistema creat per Google DeepMind. No és una màquina amb braços ni una computadora especial. És un conjunt de programes que utilitza intel·ligència artificial per resoldre problemes complexos. Però no qualsevol problema: problemes que necessiten escriure codi, programes nous, solucions lògiques. I ho fa sense ajuda humana en cada pas. Se li diu quin problema cal resoldre, com saber si una solució és bona o dolenta, i aquest comença el treball. Imaginem que vols que algú descobreixi una manera nova i més ràpida d'armar un trencaclosques. Li dones un trencaclosques, i un cronòmetre. Cada vegada que l'acaba, anota quant va tardar. Si l'arma més ràpid que abans, guarda com ho va fer. Si l'arma més lenta, ho descarta. Així funciona AlphaEvolve, però en comptes de trencaclosques, el que arma és codi per resoldre problemes reals: des de multiplicacions de matrius fins a com organitzar els feines dins dels servidors de Google.

Però anem un pas més enrere. Suposem que vols inventar una recepta de cuina. Mira de posar arròs amb xocolata. Dolentíssim. Després, arròs amb llard i all. Millor. Després, li sumes formatge Deliciós! Què vas fer? Vas provar, vas anotar, vas canviar. Això és evolució. No és tan diferent de com les espècies evolucionen: neixen variants, les millors sobreviuen, les pitjors desapareixen. AlphaEvolve fa això amb programes d'ordinador. Li dones una primera idea (encara que sigui dolenta), i ell comença a provar variants. Algunes són pitjors, d'altres, millors. I així, a poc a poc, millora fins a trobar solucions sorprenents, fins i tot superiors a les que coneixia qualsevol humà.

Superioritat humana

Pensem en un altre exemple. Tens una capsa plena de claus, hi ha un pany i ningú no sap quina clau l'obre. Una persona en prova cada una fins que, amb sort, troba la correcta. Però una altra persona anota: "aquesta clau no entra", "aquesta gira, però no obre", "aquesta entra fins a la meitat". I amb això comença a fabricar claus noves basades en el que va aprendre. Una que entra i gira, però no obre, potser necessita una dent més. Aquesta persona crea una clau nova amb aquesta dent extra. I funciona! Això és el que fa AlphaEvolve: prova programes, veu quins "entren" (serveixen), quins no, i amb aquesta informació n'inventa altres de millors.

El més impressionant és que no necessita que algú el guiï pas a pas. Només necessita dues coses: primer, un punt de partida, i segon, una regla clara que digui si alguna cosa és millor o pitjor. Per exemple, si li dius: "vull un programa que faci una multiplicació més ràpida", i li dones un cronòmetre per mesurar el temps, aquest genera programes que facin aquesta multiplicació, els cronometra, i guarda els que tarden menys. Així va descobrir una nova manera de multiplicar certs tipus de números que ni els matemàtics no havien trobat en 56 anys. No perquè "va pensar millor", sinó que perquè va provar de moltes formes, i va aprendre de cada intent.

I com sap què provar? Bo, allà entra la part d'"intel·ligència artificial". Utilitza models molt avançats, semblants als que escriuen textos o responen preguntes, però entrenats per escriure codi. És com si tingués dins seu un exèrcit de programadors provant idees sense parar, però molt més ràpid. També utilitza "prompts", que són com instruccions que li diuen què canviar, què millorar, com fer-ho. I aquests prompts no els inventa una sola vegada, sinó que també els va ajustant. Si una manera de donar instruccions funciona millor, la utilitza més.

Múltiples respostes

Una altra idea clau: AlphaEvolve no treballa amb una sola resposta. Té una "població" de respostes. Com si fos una granja d'idees. Algunes són pollets febles que no serveixen. D'altres creixen, s'enforteixen, i ajuden a crear-ne altres de millors. Manté sempre un equilibri entre provar noves idees i millorar les que ja té. Així no es queda atrapat repetint sempre el mateix. Un exemple més simple: imagina que vols ensenyar a una computadora a trobar el millor camí en un laberint. Li dones un mapa, i li dius quant tarda a sortir. La primera vegada, xoca contra totes les parets. La segona, avança una mica més. Després, aprèn que girar a l'esquerra és millor que a la dreta. Prova camins nous. I finalment troba la sortida en temps rècord. Aquesta és l'essència de AlphaEvolve, però portat al nivell de resoldre problemes que requereixen escriure centenars de línies de codi, optimitzar circuits de xips, millorar algoritmes de centres de dades, i més.

I per què això importa? Perquè hi ha molts problemes en ciència, tecnologia i matemàtica on trobar una solució no és qüestió de llegir un manual. Cal provar, fallar, millorar. AlphaEvolve accelera aquest procés. Pot treballar dia i nit, sense cansar-se, fent milions de proves. Pot col·laborar amb humans: els humans defineixen el problema i les regles, i AlphaEvolve fa el feina dur de provar i millorar. És com un científic incansable que mai no dorm i sempre està anotant tot.

Per exemple, Google el va utilitzar per millorar com assigna els treballs dins dels seus centres de dades. Abans, alguns servidors quedaven passius perquè no s'assignaven bé els recursos. AlphaEvolve va inventar una nova manera d'assignar aquests treballs, i va recuperar un 0,7% de la capacitat total. Pot semblar poc, però al món de Google, això equival a milers de computadores extra que no s'han de comprar. També el van utilitzar per millorar els programes que entrenen a altres models d'intel·ligència artificial, aconseguint que aquest entrenament fos més ràpid. Fins i tot, AlphaEvolve va ser capaç de millorar parts de codi que són dins dels xips, una cosa que normalment només fan enginyers especialistes. I també ho van provar en problemes matemàtics oberts, on va trobar noves solucions millors que totes les conegudes fins ara.

Però el més impactant encara està per venir. Què passarà en els anys vinents? Imagina que necessites crear un medicament nou. Avui, això tarda anys. Cal provar molècules, veure si funcionen, fer assajos. AlphaEvolve podria generar codis que simulin milions de molècules, seleccionar les més prometedores, optimitzar el seu disseny, i accelerar el desenvolupament de nous tractaments. O pensem en l'energia: com dissenyar turbines més eficients, panells solars més productius? Amb AlphaEvolve generant i millorant els dissenys constantment, els avenços podrien multiplicar-se.

Fins i tot veurem com ajuda a crear nous llenguatges de programació, noves arquitectures de xips quàntics, o a resoldre problemes matemàtics que fa segles que estan oberts. No perquè sigui un geni, sinó perquè té paciència infinita, memòria perfecta i velocitat per provar el que un humà mai no podria en una vida. AlphaEvolve és com un nen que aprèn a caminar amb bicicleta sense rodes. Cau, s'aixeca, prova de nou. Però aquest nen té memòria perfecta, mai no es frustra, i pot provar mil bicicletes per minut. Així, no només aprèn a caminar en bici. Inventa una nova manera de pedalar. I això, per al món de la ciència i la computació, és una revolució que tot just comença. Les coses com són.

Més