El hallazgo demuestra hasta qué punto los mapas genéticos están incompletos y sesgados, lo que puede estar afectando a la investigación médica
Investigadores españoles han descubierto más de 40.000 moléculas de ARN humano nunca antes descritas y son sólo la punta del iceberg. El hallazgo demuestra hasta qué punto los mapas genéticos están incompletos y sesgados, lo que puede estar afectando a la investigación médica.
Los mapas genéticos humanos contienen importantes puntos ciegos porque se construyeron en gran medida a partir de secuencias de ADN de personas con ascendencia europea. Esa es la conclusión de un estudio publicado este miércoles en la revista Nature Communications.
Los investigadores descubrieron miles de transcripciones faltantes (moléculas de ARN que llevan las instrucciones de un gen) en personas de poblaciones de África, Asia y las Américas, posiblemente incluyendo productos de genes completamente nuevos que los científicos aún no han descubierto.
Algunas de estas transcripciones también aparecen en genes ya vinculados a enfermedades que difieren entre ascendencias, como el lupus, la artritis reumatoide, el asma y los rasgos relacionados con el colesterol.
Los hallazgos sugieren que parte de la razón por la que algunas enfermedades se presentan con mayor frecuencia o se comportan de forma diferente en ciertas poblaciones podría deberse a que sus genes producen transcripciones diferentes y, potencialmente, proteínas diferentes mediante procesos como el empalme.
Prácticamente invisibles
Estas variaciones moleculares han permanecido prácticamente invisibles en los mapas genéticos actuales, lo que ha ocultado información potencialmente importante sobre el riesgo de enfermedades.
«Los científicos utilizan mapas genéticos a diario, pero hemos estado dejando fuera a grandes sectores de la población mundial. Este estudio muestra, por primera vez, cuánto nos hemos estado perdiendo», explica Pau Clavell-Revelles, del Barcelona Supercomputing Center (BSC) y del Centro de Regulación Genómica (CRG).
El primer borrador del genoma humano, publicado en 2001, fue un logro científico fundamental, pero tenía limitaciones. La secuencia por sí sola no revelaba dónde se encontraban los genes, cuántos existían ni cómo un solo gen podía producir múltiples versiones de una proteína mediante empalme, el proceso con el que las células cortan y unen instrucciones genéticas.
Para solucionar esto, se crearon mapas de anotación genética, esto es, catálogos detallados que muestran la posición de cada gen humano y el conjunto completo de transcripciones de ARN producidas a partir de ellos.
Proyectos como Gencode transformaron los 3.000 millones de letras del genoma en algo interpretable, lo que ayudó a los científicos a comprender qué regiones impulsan las enfermedades y cómo las diferencias genéticas entre las personas podrían ser importantes.
Pero estos mapas heredaron un punto ciego. Aunque dos humanos son 99,9% idénticos genéticamente, la fracción restante refleja la historia evolutiva. Algunos grupos han vivido separados durante decenas de miles de años y han acumulado variantes distintivas moldeadas por el entorno, el azar y la geografía. Esas diferencias son reales, pero no están bien documentadas.
La referencia del genoma humano, y muchas de las anotaciones genéticas que se basan en ella, se derivaron principalmente de individuos de ascendencia europea. Por tanto, la biología específica de las poblaciones de África, Asia, Oceanía y América nunca estuvo plenamente representada en los mapas genéticos.
Esto significa que gran parte de lo que los científicos saben sobre cómo las células utilizan los genes se basa en una estrecha porción de la humanidad, lo que deja transcripciones importantes y pistas potenciales de enfermedades prácticamente invisibles.
«La mayor parte de la secuenciación genética hasta la fecha proviene de individuos europeos, por lo que los catálogos de referencia en los que nos basamos podrían contener genes o transcripciones faltantes que solo existen en poblaciones no europeas», según Roderic Guigó, investigador del CRG y la Universidad Pompeu Fabra de Barcelona.
«Una suposición que puede ser errónea»
Guigó añade: «Si una variante genética se encuentra en uno de estos genes faltantes, asumimos que no tiene efecto biológico. En algunos casos, esta suposición puede ser errónea».
Para descubrir qué faltaba en los mapas genéticos existentes, los investigadores se centraron en las transcripciones, las moléculas de ARN que muestran cómo se utilizan los genes dentro de las células humanas. Utilizaron la secuenciación de lectura larga, una tecnología que puede leer moléculas de ARN completas de principio a fin.
Los métodos anteriores solo capturaban fragmentos diminutos, lo que dificultaba la reconstrucción de las transcripciones y generaba resultados ambiguos, una de las principales razones por las que esta cuestión no se había podido abordar hasta ahora.
El equipo analizó células sanguíneas de 43 personas de ocho poblaciones, incluyendo yoruba (Nigeria), luhya (Kenia), mbuti (Congo), chinos han, telugu indio, peruanos en Lima, judíos asquenazíes y europeos de Utah.
Estos grupos también forman parte del Proyecto de los 1.000 Genomas, lo que significa que su ADN ya está bien mapeado y permite comparar directamente los nuevos datos de ARN.
Los investigadores identificaron 41.000 posibles transcripciones que faltaban en los mapas genéticos oficiales de Gencode. Se predice que un 41% de las transcripciones procedentes de genes codificadores de proteínas conocidos codifican diferentes versiones de proteínas existentes. En otras palabras, el estudio reveló miles de variantes proteicas nunca antes catalogadas.
Un ejemplo es el gen SUB1, involucrado en procesos celulares esenciales como la reparación del ADN. Los investigadores descubrieron que los individuos de ascendencia peruana producen una transcripción diferente de SUB1. Esta molécula de ARN alterada modifica la proteína resultante, pero no se encontraba en ninguna anotación genética existente.
Al agrupar los datos por ascendencia, el equipo encontró un patrón claro: las muestras no europeas contenían muchas más transcripciones inéditas que las europeas.
En total, el estudio halló 2.267 transcripciones específicas de cada población: moléculas de ARN presentes en una población, pero ausentes en todas las demás. En el caso de los grupos europeos, la mayoría de estas ya eran conocidas. En el de los no europeos, la mayoría eran completamente nuevas.
Fuente: cadenaser.com


Deja una respuesta