A la pel·lícula Jurassic Park se’ns mostra els resultats d’un experiment de ciència-ficció que intenta ressuscitar espècies de dinosaures extingides fa milions d’anys, a partir del DNA que hauria quedat capturat i indemne dins de l’interior de mosquits atrapats en ambre. Els dinosaures formen part de la nostra iconografia, probablement perquè des d’infants ens sentim atrets inexplicablement per la seva aparença. Una de les grans atraccions de molts museus d’història natural són els esquelets fòssils de dinosaure que hi exposen. Què hi ha més imponent que l’esquelet fòssil de tiranosaure al museu de Nova York, que ha protagonitzat diverses pel·lícules, o l’apatosaure del Museu Britànic d’Història Natural? Tanmateix, sempre que pensem en fòssils, ho fem a escala gran, macroscòpica, i rarament pensem que la vida als seus inicis era molt variada, i que moltes de les respostes del futur les hem de buscar en organismes que ja s’han extingit i dels quals potser no en tenim les evidències físiques, no en tenim l’esquelet, però en podem inferir l'existència a partir dels éssers vius actuals.

La història que us voldria explicar avui va molt més enllà dels museus i dels fòssils que coneixem, però us prometo que té de tot. Té una mica d’intriga, una mica de perseverança i d’intuïció, té un molt d’indagar en el passat per inferir què és el que tenim en l’actualitat, i alhora obre portes a futures aplicacions a la biomedicina o la biotecnologia que encara no hem dissenyat, ni tan sols imaginat. Us voldria parlar de bacteris extints i de ressuscitar gens i proteïnes que ara ja no existeixen, recreant aquests paleogens i paleoproteïnes mitjançant anàlisis bioinformàtiques i enginyeria genètica, per donar-los vida de nou. I per acabar-ho d’adobar, aquesta recerca ha estat realitzada majoritàriament per companys científics d’Espanya als que conec i admiro.

Primer em deixareu explicar-vos el context, un context que té Premi Nobel al darrere. Els bacteris tenen també els seus paràsits, la majoria són virus (que s’anomenen fags o bacteriòfags, és a dir “menjadors de bacteris”). Els bacteris s’han de defensar d’aquests atacs que els fulminarien i, entre altres mecanismes, han incorporat un sistema per emmagatzemar fotos del DNA dels seus atacants. Igual que la policia té un registre de fotos dels delinqüents per tal d’estar amatents i detectar la seva presència, els bacteris incorporen fragments del material genètic dels seus virus i altres paràsits, per tal de reconèixer-los si els tornen a atacar. Quan un bacteriòfag els penetra de nou, comparen el genoma de l’atacant amb els fragments de genoma foto que tenien emmagatzemats i si coincideixen, els destrueixen. I com s’ho fan? Mitjançant un bisturí molecular amb GPS, el GPS detecta que les fotos del DNA atacant i l’emmagatzemat són idèntiques, i activen un sistema de tall del DNA atacant. Aquest sistema s’anomena CRISPR (el nom que es refereix al sistema d’emmagatzemament i reconeixement del DNA) i se sol acompanyar del nom del “bisturí” molecular, l’enzim Cas9 (o d’altres similars), per tant, sistema CRISPR/Cas. Aquest sistema de reconeixement i tall del DNA és actualment usat com a base del sistema d’edició genètica a tots els laboratoris del món, una eina imprescindible com ho són els ganivets, estisores, ganivetes i bisturís de tota mena a qualsevol casa, i el nombre de patents de variants del sistema CRISPR i les seves aplicacions és immens. Penseu, per exemple, quan modifiqueu qualsevol text, sempre feu servir el cercador i el punter del ratolí per saber on aneu i com retalleu, és a dir, editeu cercant, tallant, revisant i enganxant. Doncs bé, el sistema CRISPR/Cas d’edició genètica va ser descrit per Francis Mojica (un magnífic microbiòleg d’Alacant, la història del qual us vaig explicar en un altre article), tot i que el seu ús com a eina d’edició genètica va ser premiat en el Premi Nobel de Química 2020 a Jennifer Doudna i Emmanuelle Charpentier (un dels pocs Premis Nobel exclusiu de dones científiques).

Moltes de les respostes del futur les hem de buscar en organismes que ja s’han extingit i dels quals potser no en tenim les evidències físiques, no en tenim l’esquelet, però en podem inferir l'existència a partir dels éssers vius actuals

Ara bé, aquest sistema CRISPR/Cas d’edició genètica que serveix de defensa contra atacants dels bacteris és molt i molt ancestral, ja que el trobem en espècies bacterianes molt allunyades evolutivament, i la diversitat que trobem en cada espècie reflecteix la selecció natural. El sistema CRISPR/Cas que s’empra més als laboratoris deriva de bacteris relativament comuns al nostre hàbitat, com ara Streptococcus piogenes, o Staphilococcus aureus. Per tal de buscar nous tipus i variants del sistema per a noves aplicacions o millores, una opció freqüent és cercar espècies bacterianes extremòfiles que viuen a llocs inhòspits o de difícil accés, per exemple, fonts termals dels fons abissals, o deserts, com ara el d’Atacama. En aquest cas, la diversitat bacteriana és espacial, però podríem pensar en traspassar la barrera del temps, anant a cercar-la al passat. Com podem cercar proteïnes fòssils d’espècies bacterianes extingides fa milions d’anys? Recordeu que fa poc us vaig explicar que s’ha pogut aïllar DNA de dipòsits minerals i roques de fa 2 milions d’anys com una gran fita… però podem intentar inferir quina és la seqüència més probable de gens i proteïnes ancestrals (paleoproteïnes) mitjançant la comparació de les espècies bacterianes actuals amb una anàlisi de parsimònia i, així, intentar inferir quina hauria de ser la paleoseqüència més probable.

A continuació, us poso un exemple senzill de paraules molt semblants, però que totes difereixen en una sola lletra: CASA, COLA, ROSA. Quina seria la paraula comuna a totes elles, a partir de la qual haurien evolucionat, només canviant una lletra? Si les alineem i comparem, veureu que podem proposar COSA com a paraula original, ja que totes les altres se’n derivarien fàcilment només canviant la lletra remarcada en vermell. Aquest exemple senzill em permet exemplificar com es fan les anàlisis bioinformàtiques d’alineament i de cerca de la paraula ancestral més parsimoniosa, la que necessitaria menys canvis per generar les altres tres paraules.

cosa casa cola rosa
Si fem un joc per identificar la paraula inicial de la qual podrien derivar les paraules CASA, COLA, ROSA. Alineant-les podem veure que només amb el canvi d’una lletra, la paraula COSA podria ser, molt probablement, la paraula inicial o “ancestral” de la qual les altres derivarien.

Així, doncs, els investigadors han fet aquesta anàlisi d’inferència per trobar noves eines Cas (els enzims que tallen el DNA), comparant espècies bacterianes actuals de les quals es calcula que van divergir dels seus ancestres comuns fa 37, 137, 200, 1.000 i 2.600 milions d’anys. Això és increïble! Penseu que tots els dinosaures es van extingir fa uns 65 milions d’anys; que l’explosió cambriana, que va donar lloc a la majoria de classes animals que coneixem, va tenir lloc fa uns 580 milions d’anys; que la primera cèl·lula eucariota amb nucli, com les nostres, va sorgir fa uns 1.850 milions d’anys, i que la vida a la Terra té uns 3.500 milions d’anys d’antiguitat… Tot i això, els algorismes bioinformàtics són capaços d’inferir les seqüències de les proteïnes paleo-Cas de fa 2.600 milions d’anys, les quals s’assemblaven a les actuals amb més d’un 56% de similitud, mentre que les paleo-Cas de fa 37 milions d’anys, s’assemblarien en un 93%. No em digueu que no és espectacular!

I ara em podeu preguntar: i com podem saber si aquestes paleoproteïnes predites informàticament van existir realment? No ho podem saber directament, però sí que podem generar-les, ressuscitar-les mitjançant enginyeria genètica. Si sabem quina seqüència d’aminoàcids havien de tenir, podem generar sintèticament aquestes proteïnes i provar la seva activitat al laboratori, per exemple, sobre gens humans. Com potser ja intuïu, aquestes proteïnes sintètiques són eficients en reconstituir el sistema CRISPR i poden tallar el DNA. Com més a prop en el temps, més eficients i similars a les proteïnes actuals són, el qual sembla lògic. Però les més antigues en el temps tenen activitats molt interessants, segurament adients per a un món en què no només el DNA, sinó també l’RNA eren la informació genètica predominant (per als qui en voleu saber una mica més, llegiu aquest fantàstic article de divulgació de Lluís Montoliu, d’un dels científics autors d’aquest article).

Per acabar, o millor dit, per començar, el que us acabo d’explicar sobre la resurrecció de proteïnes Cas ancestrals de fa milions d’anys implica un munt de perspectives inexplorades per tal de modificar aquestes noves eines d’edició genètica. Penseu en el vostre calaix de la cuina, en quants tipus de ganivets diferents teniu… i ara, penseu en com podrem aprendre a fer servir nous tipus de ganivets ancestrals que ni tan sols podíem imaginar que van existir. A mi em fan pampallugues els ulls per totes les possibilitats i aplicacions, en el futur, de nous editors de text genètic en biotecnologia i biomedicina, que ni tan sols hauríem mai pensat que fossin possibles!