Un algoritmo predice las interacciones de las proteínas en las células

La investigación, que publica Nature Methods y en la que ha colaborado el Laboratorio Europeo de Biología Molecular de Monterotondo (Italia) y el Instituto de Tecnología de California (EEUU), es un paso más en la carrera científica por conocer los pros y contras de cada una de las regiones funcionales del genoma y qué genes se encuentran activos en cada célula, ya sean neuronas, células de la piel o del corazón.

Según ha explicado el investigador del CRG, Gian Gaetano Tartaglia, sólo una pequeña fracción del genoma humano (cerca del 2%) contiene genes que codifiquen para proteínas, que son los componentes básicos en la célula.

El 98 % restante es importante para regular la expresión de dichos genes, es decir, está implicado en controlar cuándo y dónde se activan.

Esta gran proporción del genoma produce moléculas de ARN, llamadas ARN no codificante, de distintos tamaños, estructuras y funciones.

Según el investigador, hasta ahora, no existían herramientas computacionales que permitieran estudiar secuencias largas de ARN e intentarlo mediante métodos experimentales en el laboratorio es todavía un enorme reto porque supone “ir probando a ciegas”.

Por eso, los investigadores han desarrollado la nueva herramienta computacional para predecir las interacciones de proteínas con ARNs no codificantes largos, que ellos mismos han validado experimentalmente.

“Los ARNs no codificantes largos interactúan con varias proteínas para mediar funciones celulares importantes. Intentar identificar estas interacciones puede ser un buen punto de partida para comprender el papel de estas moléculas en el funcionamiento normal de la célula, pero también para comprender qué pasa en la enfermedad,”, ha dicho Tartaglia.

Global Score, la herramienta computacional

La nueva herramienta computacional, bautizada como ‘Global Score’, permite a los científicos predecir en qué punto de la larga secuencia de ARN no codificante podría haber una interacción con una proteína.

“La estructura del ARN es absolutamente importante para predecir interacciones con proteínas. Nuestro principal reto era ser capaces de trabajar con secuencias de ARN independientemente de su longitud para poder mantener una visión completa de las propiedades de su estructura al buscar posibles proteínas candidatas a interaccionar”, ha añadido Davide Cirillo, investigador postdoctoral en el CRG.

“El algoritmo que hemos desarrollado integra toda esta información y nos permite no sólo predecir qué proteínas podrían interactuar sino también clasificarlas y establecer prioridades para su validación experimental”, ha concluido Cirillo.

Fuente: EFE