El origen de los genes nuevos
Dr. Alejandro Garciarrubio Granados
¿Qué estás leyendo papá?- me preguntó, mi hija. -Un trabajo fascinante sobre el surgimiento de genes nuevos- le respondí. -¿Quieres que te lo cuente? Aunque para ello primero tendrás que entender bien qué son los genes. ¿Te interesa?- La respuesta de mi hija me animó: -claro!-
Breve introducción sobre los genes Los genes son las unidades de la información genética. Dicho de otra forma, un gen es una región de un cromosoma que contiene la información para que la célula realice una acción o función específica. Un cromosoma es una molécula de ácido desoxirribonucleico (ADN), formada de la combinación de 4 diferentes unidades pequeñas, llamados nucleótidos, unidas una tras otra, formando largas cadenas. Así como las 27 letras del alfabeto bastan para escribir infinidad de textos, la secuencia de los 4 nucleótidos del ADN bastan para representar toda la información necesaria para definir a un ser vivo.
El genoma humano es un buen ejemplo del genoma de los vertebrados. En el humano, el genoma tiene 3 mil millones de nucleótidos ordenados en 23 cadenas separadas: estos son los cromosomas. Más aún, de cada cromosoma tenemos 2 copias: una la heredamos de nuestra madre, la otra de nuestro padre. Las regiones de ADN que constituyen genes se encuentran dispersas entre regiones que no son genes (recordemos que un gen es la unidad funcional del genoma). En total los 20,000 y pico de genes humanos suman como el 5% del genoma. El resto no sabemos bien para qué sirve.
El ADN es bastante inerte. Para que los genes tengan algún efecto, su información debe ser copiada a moléculas de ácido ribonucleico (ARN) que conserva el orden de los nucleótidos. Los ARN copiados de algunos genes llevan a cabo funciones celulares por sí mismos, pero la mayoría de los genes codifican proteínas. En estos casos, el ARN es sólo un mensaje que la célula debe decodificar para hacer una proteína específica.
Los genes son copiados a ARN (decimos que “se expresan”) en el tejido, en el momento y en la cantidad que se requiere. La expresión está cuidadosamente regulada. Por ejemplo, la hemoglobina es una proteína abundante en las células sanguíneas, cuya función es transportar el oxígeno que respiramos. El humano tiene 5 genes para esa proteína (cercanos unos a otros en una pequeña región del cromosoma 11). En el embrión temprano se expresa únicamente uno de ellos, otros 2 en el feto, y los 2 últimos en el adulto. La regulación de estos genes hace que la hemoglobina sea sutilmente distinta, y óptima para las necesidades cambiantes del organismo.
El cuándo, dónde y cuánto se expresa un gen depende de secuencias de nucleótidos aledañas al gen. Si bien la célula sabe interpretarlas perfectamente, los científicos solo han identificado, y muy imprecisamente, algunas de ellas. Actualmente es casi trivial conocer la secuencia de nucleótidos del genoma de cualquier especie. Pero si conocemos solamente la secuencia, somos muy malos adivinando dónde están los genes, y totalmente ineptos prediciendo cómo se regularán.
Así que la identificación de genes se hace por medios indirectos. Por ejemplo, conocemos la secuencia de aminoácidos de muchas proteínas, y podemos buscar si el genoma contiene genes que codifican una proteína similar. Otro método depende del hecho que, al divergir de un ancestro común, los genomas acumulan cambios en su secuencia, pero muchos menos en los genes. Así que las regiones que se mantienen muy similares, digamos entre humano y ratón, suelen corresponder a genes que probablemente tendrán funciones similares en ambas especies.
Una de las mejores formas de descubrir un gen es encontrar un ARN que fue copiado de él. Por supuesto, los ARN son más fáciles de encontrar si el gen se expresa abundantemente y en muchos tejidos. Si un gen se expresa en poquísimas células, o en momentos muy específicos o a muy bajos niveles, encontrar el ARN es harto más complicado.
Los genes del humano han sido buscados con las estrategias mencionadas, ¡y muchas más! Probablemente ninguna otra especie ha sido estudiada con más ahínco y minuciosidad. Por eso, desde hace varios años estuvimos convencidos de que la lista de los 20,000 genes conocidos es casi la definitiva.
La explicación estándar al origen de nuevos genes es que eventos fortuitos pueden causar la duplicación de una región de un cromosoma, por lo que ahora los genes en esa región también están duplicados. En ese momento ambas copias del gen son idénticas en secuencia y en función, pero a lo largo de millones de años la acumulación de mutaciones los hará distintos hasta convertirlos en genes diferentes. Este es sin duda el caso de los 5 genes de las hemoglobinas que mencionamos antes: el parecido en su secuencia denota su origen común.
Los genes nuevos
Casi todas las especies tienen unos pocos genes que parecen ser nuevos en otro sentido: por más que buscamos, no encontramos un gen similar, ni en la misma especie, ni en especies relacionadas, ni en especies más lejanas. Imaginemos un gen que sólo esté en el humano, pero no en el chimpancé, ni el gorila, ni el macaco, ni el ratón, ni en peces, ni moscas, ni levaduras: sólo en el humano. Podríamos proponer que el gen se perdió de todos los otros linajes, pero la explicación más sencilla es suponer que se “inventó” después que el humano se separó de ellos -más recientemente que la separación de humanos y chimpancés, hace seis millones de años-. Casos similares se han encontrado en muchas especies, y por no tener “parientes” a estos genes se les llama “huérfanos”.
Nadie sabe cómo surgen los genes huérfanos, pero no puede ser por duplicación (pues entonces encontraríamos parientes del gen original, que no es huérfano). Hasta hace muy poco, habíamos encontrado una docena de genes huérfanos en el humano. Aquí es donde empieza este trabajo que quiero comentar.
Unos científicos diseñaron una estrategia para buscar genes huérfanos en humano y chimpancé. Querían encontrar genes que estuvieran en alguna (o en ambas) de estas dos especies tan próximas, pero no en otras un poco más lejanas: el macaco y el ratón. Los genes que codifican proteínas se copian por un sistema especial que deja en los ARN dos huellas particulares (llamadas “intrones” y “poli-A”) que los científicos aprovecharon para estudiar este tipo de genes. De las 4 especies y de muchos de sus tejidos, secuenciaron miles de millones de moléculas de ARN para encontrar hasta las menos comunes.
Por supuesto que hallaron todos los genes conocidos. Algo sorprendente es que además encontraron muchísimos ARN que vienen de regiones del genoma donde no se sabía que había genes. Para el humano, 30% de esas regiones no corresponden a “la lista” de los 20,000 genes conocidos. No sólo eso, en total encontraron 2,714 genes huérfanos (634 de humano, 780 de chimpancé y 1,300 que están en ambos). Esto quiere decir que hay 2,714 genes que han surgido (aparentemente de la nada) en el breve tiempo desde que el chimpancé y el humano se separaron del gorila (donde no existen estos nuevos genes).
¡Esta es una velocidad vertiginosa de aparición de genes! Aún mejor, dado el gran parecido entre el genoma del humano y del chimpancé con el del macaco, resultó fácil ver que las secuencias de estos genes están allí, casi idénticas, en las regiones correspondientes del genoma del macaco, lo sorprendente es que allí no son genes: ¡no se copian a ARN!
¿Por qué en el humano o chimpancé se volvieron genes? Comparando cuidadosamente contra el macaco, se vio que para volverse genes habían ganado varias secuencias aledañas que la célula sabe reconocer para su copiado a ARN (que los científicos llaman “sitios de unión de factores transcripciones” y “señales de elongación”).
¿Y qué van a hacer los científicos con tantos genes nuevos? ¿Van a crecer la lista de 20,000 a 30,000? … Lo más probable es que no. La mayoría se expresa a niveles muy, muy bajos, y al parecer no tienen una función muy importante (son lo que se podría llamar «aprendices de genes»). Sólo un puñado parece tener una función, sobre todo en el cerebro (que, ya sabíamos, es un gran usuario de genes nuevos).
Las moralejas son varias: el genoma humano no está tan bien conocido como a veces creemos; cualquier región del ADN puede fácilmente convertirse en gen; los genes nacen a cada rato, pero la mayoría muere sin llegar a la madurez; aun así, son un gran semillero para nuevas funciones, y, por último, tal vez la duplicación de genes -y su posterior divergencia- no sea el origen de la mayoría de los genes conocidos.
Contacto: alejandro@ibt.unam.mx