Una película bastante entretenida denominada The imitation game explica de manera novelada cómo el genio matemático Alan Turing, con el encargo del servicio secreto británico, creó y dirigió un grupo de aficionados a resolver problemas matemáticos con el fin de crear una máquina que permitiera desencriptar los mensajes que los nazis se enviaban durante la Segunda Guerra Mundial. Estos mensajes, aparentemente irrelevantes, estaban cifrados en un código, que denominaron Enigma. Para descifrarlos había que comprender cómo funcionaba esta encriptación, por eso había que buscar todas las combinaciones posibles hasta encontrar finalmente el código que permitía la transcripción, letra a letra, y la traducción del mensaje. Sobra decir que lo consiguieron, después de "sudar sangre" y pudieron interferir en los planes de los nazis contra los aliados, siendo un elemento importante para, finalmente, ganar la guerra.

Escribir en secreto, de manera que solo unos pocos o solo nosotros podamos entender el mensaje cautiva nuestra imaginación. Muchos de nosotros hemos jugado de pequeños a escribir con tinta "invisible", que solo se puede ver calentando un poco el papel, o inventándonos un lenguaje especial que necesitaba un código, evidentemente secreto, para hacer la traducción.

La vida se basa en un flujo de información de una célula madre a una hija, y este es el objetivo de la genética, comprender cómo es esta información, cómo está almacenada, cómo se transmite y cómo se ejecuta. Los ácidos nucleicos son el material genético en el que se encuentra nuestro manual de instrucciones como organismos. La gran mayoría de organismos tiene DNA como material genético de almacenaje, este es el que está en cromosomas y el que copiamos para pasarlo de células madres a hijas, y de progenitores a descendientes. Sin embargo, las proteínas son las ejecutoras de la función, y los ácidos nucleicos son muy diferentes de las proteínas. ¿Cómo podemos pasar de un manual de instrucciones, el DNA, a las proteínas funcionales? Para hacer esto, hay que cambiar de lenguaje, y tener un código genético que nos permita pasar del "lenguaje" del DNA al de las proteínas. De forma similar a cuando queremos construir una figura muy compleja con piezas de Lego o Tente, nos hace falta un buen manual de instrucciones, que tendremos que leer instrucción a instrucción, y además, tener todas las piezas pequeñas que tendremos que ir engargolando siguiendo las instrucciones.

La vida se basa en un flujo de información de una célula madre a una hija, y este es el objetivo de la genética, comprender cómo es esta información, cómo está almacenada, cómo se transmite y cómo se ejecuta

Llamamos gen a cada instrucción genética concreta. Hay que leer la información codificada en un gen para hacer una proteína, y cada proteína se hará usando piezas más pequeñas (los aminoácidos), que hay que ir uniendo de forma ordenada y correcta. Como el manual de instrucciones es muy grande, tenemos que hacer fotocopias de cada instrucción (que llamamos RNA mensajero) para ir produciendo cada proteína por separado. El lenguaje del DNA está formado por 4 letras (A, T, C, G). Como las palabras genéticas (codones) son de tres letras, con combinaciones de cuatro letras, tenemos 64 palabras posibles. En cambio, ladrillos para hacer las proteínas, los aminoácidos, tenemos básicamente 20 tipos diferentes. Por lo tanto, el código genético es un código de significado, que traduce cada codón de tres letras de ácido nucleico a un aminoácido concreto. De hecho, decimos que el código genético es degenerado cuando queremos decir que tiene palabras sinónimas, porque como tenemos muchas más palabras que aminoácidos, hay diferentes palabras que codifican para el mismo aminoácido. Como sabéis, en cualquier frase es muy importante saber dónde acaba. Por eso, hay tres palabras o codones que no tienen traducción, es decir, no tienen asignado ningún aminoácido sino que son señales de paro. Son el punto final, hasta allí llega la proteína.

Así, pues, cuando "leemos" un gen, podemos saber cuál es el inicio de la frase y dónde está el final. A partir de la palabra de tres letras iniciales, se va leyendo cada palabra de tres en tres letras, y gracias al código genético, se puede descodificar el aminoácido que corresponde, por orden. Resumiendo, el código genético nos permite pasar del lenguaje de los ácidos nucleicos al de las proteínas, y eso se puede hacer porque existen unas moléculas adaptadoras, como si fueran nuestros dedos, que van poniendo de manera consecutiva y muy ordenada cada pieza, siguiendo la secuencia de palabras de tres letras en el gen y usando el código para traducir, hasta que llegamos a la señal de parar. Esta complejidad y el hecho que todos los seres vivos que conocemos actualmente utilicen exactamente el mismo código genético nos indica que la vida actual ha tenido el mismo origen. Eso permite coger información genética de una bacteria o de una planta y ponerla en un animal, o coger un gen humano y ponerlo en una levadura (eso es la transgénesis, sea natural o generada en un laboratorio). El código genético es el mismo y el mismo gen será traducido por la misma proteína, independientemente del organismo. Ahora bien, la biología es la ciencia de las excepciones y, por lo tanto, existen pequeñas variaciones sobre el código genético. Por ejemplo, nuestros mitocondrios, como los de otros organismos, tienen unas pocas palabras cambiadas (dos o tres), pero todo el resto del código se mantiene.

Pues bien, toda esta larga introducción es para explicaros una de las noticias de la semana, publicada en Nature. Entre los organismos más interesantes, también porque son muy ancestrales, los protozoos (microorganismos formados por una única célula eucariota) presentan modificaciones secundarias en muchos procesos relacionados con la información genética. Hay protozoos de vida libre, como las amebas, o los paramecios, pero también hay muchos que son parásitos y causan enfermedades tan graves y conocidas nuestras como la malaria, la triquinosis, la leishmaniasis o la enfermedad del sueño. La selección natural ha hecho sibilinos estos parásitos, pasan desapercibidos y latentes durante cierto tiempo, y como son eucariotas (es decir, sus células tienen núcleo donde guardan su DNA), son bastante similares a nuestras células y, por eso, las enfermedades que causan son difíciles de curar. En todo caso, son organismos genéticamente "traviesos" y fascina su "creatividad" genética en comparación con el resto de hongos, plantas o animales, bastante más ortodoxos. La gran noticia de la semana es que, analizando una especie de protozoos (Blastocrithidia nonstop, fijaos bien en el nombre de la especie, un juego de palabras), unos investigadores han descubierto que sus genes están llenos de señales de parar (STOP, en inglés). Sabemos que eso no puede ser, porque entonces no podrían hacer proteínas y, por lo tanto, no podrían vivir, pero comparando sus genes con los genes de otros organismos similares, los investigadores infieren que, forzosamente, tienen que tener un código genético adaptado, un poco diferente, sobre todo con respecto a los codones de paro, que en su genoma y con su código genético, tienen significado.

Los mismos autores, en un ejercicio fantástico de divulgación, lo explican en un texto, que constituye la portada de Nature y que os adjunto. Si entendéis el inglés, el "juego de palabras" es magnífico. ¡Fijaos en que hay muchos puntos en medio de las frases, eso es como lo leeríamos con el código genético universal, porque la puntuación no es la esperada, es diferente! Un poco más adelante, encontraréis letras en blanco, que nos indican, en un símil, cómo lo leerían, correctamente, estos parásitos.

Portada nature quiere 613 num 7945
Portada de Nature, volumen 613, número 7945, 26 Enero de 2023, en la que con un ejemplo de texto se ejemplariza el código genético modificado del protozoo Blastocrithidia nonstop.

Lo que pasa en este pequeño protozoo parásito es que donde tendría que poner los aminoácidos E (ácido glutámico) y W (triptófano), encontramos puntos, según el código genético común a todos, por eso, para nosotros y el resto de organismos, la frase no acaba de tener sentido, porque está parada donde no corresponde. En cambio, según el código genético modificado, este parásito puede leer y descodificar estos "puntos o señales de paro" para colocar exactamente el aminoácido que le corresponde. No entraré en detalles técnicos sobre la manera cómo B. nonstop ha sido capaz de generar su propio código Enigma, pero para los que nos dedicamos a ello es sencillamente apasionante y abre perspectivas factibles para desarrollar nuevas herramientas de biología sintética, en las que quizás nos inventaremos nuevos códigos genéticos para codificar proteínas que no existen y que ejecutarán funciones que, ahora mismo, ni podemos imaginar. ¿Cuántos códigos Enigma diferentes podremos llegar a generar?