Cassie, el robot que aprendió a andar solo, amenaza a Boston Dynamics

Los videos del gigante de la robótica resultan impresionantes, pero tienen truco: sus máquinas requieren ajustes manuales para sus acrobacias. En cambio, este robot bípedo descubrió cómo caminar por el mundo real y recuperarse de un tropiezo sin ayuda gracias al aprendizaje reforzado

Un robot bípedo llamado Cassie ha aprendido a caminar mediante aprendizaje reforzado, la técnica de entrenamiento que enseña comportamiento complejo a los modelos de inteligencia artificial (IA) mediante prueba y error. Este robot bípedo aprendió una variedad de movimientos desde cero, incluido caminar en cuclillas mientras llevaba una carga inesperada.

Pero ¿puede bailar? Las expectativas sobre lo que pueden hacer los robots son cada vez mayores gracias a los vídeos virales de Boston Dynamics, que muestran a su robot humanoide Atlas balanceándose sobre una pierna, saltando cajas y bailando. Estos vídeos han acumulado millones de visualizaciones e incluso han sido parodiados. El control que Atlas tiene sobre sus movimientos es impresionante, pero las secuencias coreografiadas probablemente impliquen muchos ajustes manuales. (Boston Dynamics no ha publicado más detalles, por lo que es difícil decir cuánto).

«Estos vídeos pueden llevar a algunas personas a creer que se trata de un problema fácil de resolver. Pero todavía tenemos un largo camino por recorrer para que los robots humanoides operen de manera fiable y sobrevivan en los entornos humanos», señala el experto de la Universidad de California en Berkeley (EE. UU.) Zhongyu Li quien trabajó en Cassie con sus colegas. Su autómata aún no puede bailar, pero, dado su tamaño humano, enseñarle a caminar por sí solo lo acerca varios pasos a adquirir capacidad de desplazarse por una gran variedad de terrenos y recuperarse cuando tropieza o se da algún golpe.

Limitaciones virtuales: el aprendizaje reforzado se ha utilizado para entrenar a muchos bots a caminar en entornos simulados, pero transferir esa capacidad al mundo real resulta difícil. «Muchos de los vídeos que se ven de agentes virtuales no son en absoluto realistas», asegura la investigadora de inteligencia artificial y robótica de la Universidad de Stanford (EE. UU.) Chelsea Finn, que no participó en ese trabajo de Berkeley. Cuando un robot intenta aplicar lo que ha aprendido, pueden ocurrir grandes fallos provocados por las pequeñas diferencias entre las leyes físicas simuladas dentro de un entorno virtual y las reales fuera de él, como la forma en la que funciona la fricción entre las piernas del robot y el suelo. Un robot bípedo pesado puede perder el equilibrio y caerse si sus movimientos se descontrolan mínimamente.

Doble simulación: pero sería peligroso entrenar a un robot grande a través de prueba y error en el mundo real. Para solucionar estos problemas, el equipo de Berkeley utilizó dos niveles de entorno virtual. En el primero, una versión simulada de Cassie aprendió a caminar basándose en una gran base de datos de movimientos de robots ya existente. Luego, esta simulación se transfirió a un segundo entorno virtual denominado SimMechanics que refleja la física del mundo real con un alto grado de precisión, pero con otra velocidad de ejecución. Solo cuando Cassie pareció caminar bien, se introdujo el modelo que aprendió a caminar en el robot real.

La verdadera Cassie pudo caminar utilizando el modelo aprendido mediante la simulación sin ningún ajuste adicional. Es capaz de caminar por terreno escarpado y resbaladizo, llevar cargas inesperadas y recuperarse de un empujón. Durante las pruebas, Cassie también dañó dos motores en su pierna derecha, pero pudo ajustar sus movimientos para compensar el problema. Finn cree que se trata de un trabajo fascinante. El director del Robot Learning Lab del Imperial College de Londres (Reino Unido), Edward Johns, está de acuerdo: «Este es uno de los ejemplos más exitosos que he visto».

El equipo de Berkeley espera usar su método para ampliar el repertorio de los movimientos de Cassie. Pero no hay que esperar que pueda bailar dentro de poco.

Fuente: technologyreview.es