Gran apuesta por cuántos genes tienen los humanos

Casi 18 años después de que concluyera el Proyecto del Genoma Humano, los científicos no se ponen de acuerdo para responder esta pregunta. Lo cierto es que parecen ser menos de lo que se creía.

En el año 2000 concluyó uno de los proyectos más ambiciosos de la ciencia, el Proyecto del Genoma Humano, una investigación que prometía mapear y descifrar cuántos genes tiene la especie humana, lo que además daría luz sobre cómo descifrar varias de las enfermedades genéticas que aún son un enigma. El proyecto, sin embargo, no logró una cifra clara.

Comenzó entonces una competencia por responder ese acertijo. Ewan Birney, actual codirector del Instituto Europeo de Bioinformática, medio en serio medio en broma, lanzó el concurso GeneSweep. El premio en juego eran apenas US$3.000, pero hubo más de 1.000 participantes y el estimado de genes varió entre 312.000 y 26.000, con un promedio de 40.000.

Pero en estos 18 años hemos visto estos números ir y venir. Según explica la revista Nature, “el recuento de genes puede variar según los datos que se analicen, las herramientas utilizadas y los criterios para descartar falsos positivos”. Razón por la que cifras más altas o más bajas han empezado a aparecer en el panorama.

A pesar de que el Proyecto del Genoma Humano llegó a la idea de que hay más o menos 25.000 genes humanos, también se cree que muchos de estos podrían ser “pseudo genes”. Es decir, genes que no codifican ningún tipo de proteína, por lo que no cuentan como tales. Es así como, con estos datos sobre la mesa, otros proyectos se han dedicado a dar nuevos estimados.

Uno de ellos, bautizado como el proyecto GTex, que se enfocó en secuenciar el ARN de 30 tejidos diferentes obtenidos de cadáveres, llegó a la conclusión de que hay 21.306 genes que codifican proteínas, mientras que hay 21.856 genes que no lo hacen. Pero, de nuevo, el número varía dependiendo de quién lo dé.

Dos proyectos más, el Gencode, del Instituto Europeo de Bioinformática, y el RefSeq, del Centro Nacional para la Información Biotecnológica de Estados Unidos, les han dado otros números a estas categorías: 19.901 genes que codifican proteínas y 15.779 que no, dice el primero. Y 20.203 que codifican proteínas y 17.871 que no, dice el segundo.

¿A qué lista creerle? ¿Con cuál casarse? ¿A qué se deben las diferencias?

En palabras de Cassandra Willyard, periodista de Nature, uno de los factores que pueden explicar la diversidad de resultados tiene que ver con el volumen de datos. Además, asegura, mientras Gencode y RefSeq hacen una curaduría manual de los datos (una persona revisa la evidencia de cada gen y toma una determinación final), el proyecto GTex deja que un programa computacional los filtre.

A esto hay que sumar que entre los tres proyectos han revisado los resultados unos de otros sin encontrar variables similares. Por ejemplo, Kim Pruitt, investigador de RefSeq, le dijo a Nature que su equipo había examinado una docena de los nuevos genes codificadores de proteínas descubiertos por GTex, pero no encontró que cumplieran con los criterios de RefSeq. “Algunos se superponen con regiones del genoma que parecen pertenecer a retrovirus que invadieron los genomas de nuestros antepasados; otros pertenecen a otros tramos repetitivos, que rara vez se traducen en proteínas”, explicó.

Lo cierto es que llegar a un número exacto de genes humanos y “útiles” no parece estar a la vuelta de la esquina. Como lo dijo Pruitt a Nature, “la gente quiere una respuesta, pero la biología es compleja”.

Fuente: elespectador.com