Un programa de IA de la compañía DeepMind descifra cómo una proteína adquiere su forma tridimensional, un hallazgo que ayudará a entender mejor cómo se producen las enfermedades y a acelerar el desarrollo de fármacos
Las proteínas son esenciales para la vida. Son moléculas complejas compuestas por cadenas de aminoácidos y las funciones que desempeñan dependen en gran medida de su estructura en tres dimensiones, que es única para cada proteína. Por ello, averiguar cómo adquieren su forma tridimensional ha sido uno de los anhelos de los biólogos desde hace 50 años. Un enigma que se conoce como el problema del plegamiento de la proteína (protein folding problem, en inglés) y que ahora la inteligencia artificial parece haber resuelto casi totalmente.
Así lo aseguró el lunes compañía DeepMind. A través del deep learning (aprendizaje profundo), la última versión de su sistema de inteligencia artificial AlphaFold ha conseguido descifrar cómo las proteínas adquieren su forma, tal y como reconocieron los organizadores del concurso CASP (Evaluación crítica de las técnicas para la predicción estructural proteica, Critical Assessment of protein Structure Prediction en inglés), un experimento comunitario que se celebra dos veces al año.
“Este hito demuestra el impacto que la inteligencia artificial puede tener en los descubrimientos científicos y su potencial para acelerar el progreso en algunos de los campos más importantes que explican y modelan nuestro mundo”, ha señalado la compañía DeepMind, fundada en 2010 y adquirida por Google hace seis años.
Las proteínas juegan un papel esencial en muchos procesos, desde el desarrollo de una enfermedad y por tanto en el descubrimiento de tratamientos médicos para combatirlas, a la búsqueda de enzimas que destruyan desechos industriales. Por eso, conocer cómo adquieren su forma, señalan los ingenieros de DeepMind, puede ayudar a acelerar el desarrollo de fármacos para tratar enfermedades, incluyendo la Covid-19, y a mejorar procesos industriales. Pero también a conocer mejor cómo funciona el cuerpo humano y el mundo.
“Esto va a cambiar la medicina, va a cambiar la investigación y la bioingeniería. Lo va a cambiar todo”, asegura Andrei Lupas, biólogo en el Instituto Max Planck de Biología del Desarrollo en Tübingen, Germany. Tal y como declaró a la revista Nature, el programa AlphaFold le ha ayudado ya a descubrir la estructura de una proteína en su laboratorio con la que trabajaba desde hace una década.
El éxito de la proteína
La función biológica que desempeña una proteína depende de su correcto plegamiento. Se trata de un proceso espontáneo y termodinámicamente irreversible: si una proteína no se pliega correctamente, no será funcional y, por lo tanto, no podrá cumplir con su función biológica.
El problema del doblamiento de la proteína surgió en los años 60, con la aparición de las primeras estructuras de proteínas con resolución atómica. Algunas tenían una forma interna esperada pero otras no. Así que se planteó este enigma, que a su vez encierra tres puzzles relacionados para averiguar tres cuestiones: qué es el código de doblamiento, cuál es el mecanismo de doblamiento y si se puede predecir la estructura original de una proteína a partir de su secuencia de aminoácidos.
En los últimos años ha habido avances para resolver este enigma y en la actualidad las estructuras de pequeñas proteínas se pueden predecir con varias técnicas complejas de análisis de materiales como la criomicroscopía electrónica, la resonancia magnética nuclear o la cristalografía de rayos-X. Se trata de métodos complejos que requieren largos y laboriosos experimentos y equipos tecnológicos caros para llevarlos a cabo.
El aprendizaje de la máquina
El programa de DeepMind ha aprendido a reconocer cómo se forman estas estructuras y es capaz de averiguar la forma tridimensional de proteína en cuestión de horas.
“Se trata de algo muy importante. En cierto modo, el problema ha sido resuelto”, ha declarado John Moult, biólogo computacional en la Unversidad de Maryland y uno de los fundadores del concurso CASP para mejorar los métodos computacionales que permiten predecir de forma correcta las estructuras de las proteínas.
Tal y como han explicado los ingenieros de DeepMind, su programa AlphaFold ha sido entrenado con una base de datos pública que contiene 170.000 estructuras de proteínas, a partir de las cuales aprendió a identificar su forma tridimensional. La primera versión del programa de inteligencia artificial AlphaFold participó en el concurso CASP en 2018, logrando predecir la estructura de las proteínas con una fiabilidad de 60 (en una escala de 100 puntos). En la edición celebrada ahora, la nueva versión de AlphaFold ha logrado una puntuación de 90 sobre 100.
Los ingenieros de DeepMind esperan que su programa les ayude a identificar proteínas que han funcionado de manera incorrecta y a averiguar por qué, lo que podría ayudar a desarrollar de forma más precisa y más rápida nuevos fármacos. La IA complementaría a los métodos experimentales actuales para el desarrollo de medicamentos.
La predicción de la estructura de una proteína, añaden, podría ser útil también para responder ante futuras pandemas como la del coronavirus. A principios de año, fueron capaces de predecir las estructuras de varias proteínas del coronavirus SARS-CoV-2, entre ellas la ORF3a y la ORF8.
Fuente: elmundo.es