La IA ha resuelto un acertijo matemático clave para entender el mundo

Las ecuaciones diferenciales parciales pueden describirlo todo, desde el movimiento planetario hasta la tectónica de placas, pero siempre habían sido muy difíciles de resolver. Una nueva inteligencia artificial ha logrado hacerlo muy rápido y con muy poco margen de error dentro el espacio de Fourier

A menos que sea físico o ingeniero, realmente no hay muchas razones para que sepa qué son las ecuaciones diferenciales en derivadas parciales. Lo sé. Después de años analizándolas detenidamente en la universidad mientras estudiaba ingeniería mecánica, nunca volví a usarlas en el mundo real.

Pero las ecuaciones diferenciales en derivadas parciales (PDE, por sus siglas en inglés), también tienen algo de mágico. Son una categoría de ecuaciones matemáticas realmente buenas para describir los cambios en el espacio y en el tiempo y, por eso, muy útiles para explicar los fenómenos físicos en nuestro universo. Se pueden usar para modelar cualquier cosa, desde las órbitas planetarias hasta las placas tectónicas y la turbulencia del aire que afecta un vuelo, lo que a su vez nos permite realizar muchas cosas, como predecir la actividad sísmica y diseñar aviones seguros.

El problema consiste en que las PDE son muy difíciles de resolver. Y el significado de “resolver” quizás se explica mejor con un ejemplo. Supongamos que queremos simular turbulencias de aire para probar un nuevo diseño de avión. Existe una conocida PDE llamada Navier-Stokes que se usa para describir el movimiento de cualquier fluido. “Resolver” la PDE Navier-Stokes permite captar el movimiento del aire (también conocido como las condiciones del viento) en cualquier momento y modelar cómo seguirá moviéndose, o cómo se movía antes.

Estos cálculos son muy complejos y computacionalmente intensos, razón por la cual las disciplinas que usan muchas PDE suelen depender de superordenadores para hacer los cálculos. También es un motivo por el que el campo de la inteligencia artificial (IA) se ha interesado especialmente en estas ecuaciones. Si pudiéramos utilizar el aprendizaje profundo para acelerar el proceso de su resolución, podría ser muy beneficioso para la investigación científica y la ingeniería.

Los investigadores del Instituto de Tecnología de California (Caltech, EE. UU.) han presentado una nueva técnica de aprendizaje profundo para resolver las PDE que es mucho más precisa que los métodos de aprendizaje profundo desarrollados anteriormente. También es mucho más generalizable, capaz de resolver familias enteras de las PDE, como la ecuación de Navier-Stokes para cualquier tipo de fluido, sin necesidad de volver a entrenarse. Además, es 1.000 veces más rápida que las fórmulas matemáticas tradicionales, lo que reduciría nuestra dependencia de los superordenadores y aumentaría nuestra capacidad computacional para modelar otros problemas aún mayores. Así es. A ver cómo funciona.

Felicitaciones de MC Hammer

Antes de profundizar en qué hicieron los investigadores, veamos los resultados. En el GIF a continuación, se puede ver una demostración impresionante. La primera columna muestra dos instantáneas del movimiento de un fluido; la segunda muestra cómo el fluido continuó moviéndose en la vida real; y la tercera es la predicción de la red neuronal sobre cómo se movería el fluido. Básicamente parece idéntica a la segunda.

Cuando la función encaja

Lo primero que hay que entender aquí es que las redes neuronales son básicamente aproximaciones de funciones. (¿El qué?) Cuando se entrenan en un conjunto de datos de entradas y salidas emparejadas, en realidad están calculando la función, o una serie de operaciones matemáticas, que transpondrán una a la otra.

Por ejemplo, queremos construir un detector de gatos. Hay que entrenar la red neuronal alimentándola con muchas imágenes de gatos y cosas que no son gatos (las entradas), etiquetando cada grupo con un uno o cero, respectivamente (las salidas). Luego, la red neuronal busca la mejor función capaz de convertir cada imagen de un gato en un uno y cada imagen de todo lo demás en un cero. Así es como puede observar una nueva imagen y responder si es un gato o no. Utiliza la función que encontró para calcular su respuesta, y si su entrenamiento fue bueno, lo acertará la mayor parte del tiempo.

Este proceso de aproximación de funciones es lo que necesitamos para resolver una PDE. Al final se trata de encontrar una función que describa mejor, por ejemplo, el movimiento de las partículas de aire en el espacio físico y en el tiempo.

Es ahí donde está la clave del artículo. Las redes neuronales generalmente se entrenan para aproximar las funciones entre las entradas y salidas definidas en el espacio euclídeo, el gráfico clásico con ejes x, y, z. Pero esta vez, los investigadores decidieron definir las entradas y salidas en el espacio de Fourier, que es un tipo especial de gráfico para trazar frecuencias de onda.

Su idea, que se basó en el trabajo en otros campos, es que algo como el movimiento del aire en realidad puede describirse como una combinación de frecuencias de onda, explica la profesora de Caltech Anima Anandkumar, que supervisó la investigación junto con sus colegas, los profesores Andrew Stuart y Kaushik Bhattacharya. La dirección general del viento a nivel macro es como una baja frecuencia con olas muy largas y lentas, mientras que los pequeños remolinos que se forman en el nivel micro son como las frecuencias altas con olas muy cortas y rápidas.

¿Por qué es importante esto? Porque es mucho más fácil aproximarse a una función de Fourier en el espacio de Fourier que resolver las PDE en el espacio euclídeo, simplificando enormemente el trabajo de la red neuronal. Genera grandes beneficios de precisión y eficiencia: además de su enorme ventaja de velocidad sobre los métodos tradicionales, su técnica tiene una tasa de error 30 % más baja para resolver Navier-Stokes que los anteriores métodos de aprendizaje profundo.

Todo eso resulta mucho más ingenioso y también hace que el método sea más generalizable. Los anteriores métodos de aprendizaje profundo tenían que entrenarse por separado para cada tipo de fluido, mientras que este solo necesita ser entrenado una vez para manejarlos todos, según confirmaron los experimentos de los investigadores. Aunque aún no han intentado extenderlo a otros ejemplos, también debería poder manejar cualquier estructura de la Tierra al resolver las PDE relacionadas con la actividad sísmica, o cualquier tipo de material resolviendo las PDE de la conductividad térmica.

Supersimulación

Los profesores y sus estudiantes de doctorado no realizaron esta investigación por simple diversión teórica. Quieren llevar la IA a más disciplinas científicas. Hablando con varios colaboradores de ciencia climática, sismología y ciencia de materiales Anandkumar decidió abordar el desafío de las PDE con sus colegas y estudiantes. Actualmente están trabajando para poner en práctica su método con otros investigadores de Caltech y el Laboratorio Nacional Lawrence Berkeley.

Un tema de investigación sobre el que Anandkumar está especialmente entusiasmada es el cambio climático. Navier-Stokes no solo es bueno para modelar turbulencias de aire; también se usa para modelar los patrones climáticos. La investigadora afirma: “Tener predicciones meteorológicas a escala global buenas y detalladas es un problema muy desafiante, y en la actualidad no podemos lograrlo a escala global ni siquiera con los superordenadores más grandes. Así que, si podemos usar estos métodos para acelerar todo el proceso, sería algo tremendamente impactante”.

Y añade que hay muchas más aplicaciones: “En ese sentido, el cielo es el límite, ya que tenemos una forma general de acelerar todas estas aplicaciones”.

Fuente: technologyreview.es