Un robot aprende a usar herramientas mediante observación y experimentación
Aprender a usar herramientas tuvo un papel crucial en la evolución de la inteligencia humana. Así que también podría resultar esencial para crear robots más inteligentes y capaces. Esto es lo que propone esta nueva investigación, que demuestra que los robots son capaces de descubrir por sí mismos algunas de las funciones y usos de las herramientas, mediante una combinación de experimentación y observación de las personas.
La investigadora de Google Brain Chelsea Finn, y el profesor asistente de Universidad de California en Berkeley (ambos en EE. UU.) Sergey Levine, han desarrollado un sistema robótico junto con varios estudiantes de Levine. (Finn y Levine fueron ganadores de nuestra competición Innovadores menores de 35 MIT Technology Review en 2018 y 2016, respectivamente). Su creación consiste en un brazo robótico comercial que puede ser controlado por una persona o un ordenador. También incluye una cámara que ve el entorno al alcance del brazo y, lo más importante, un ordenador que ejecuta una gran red neuronal que le permite aprender.
El robot descubrió cómo usar algunos instrumentos simples, como un recogedor, una escoba y un plumero, así como mover otros objetos. El trabajo muestra que, algún día, los robots podrían aprender a realizar manipulaciones sofisticadas y resolver problemas abstractos por sí mismos. Fin afirma: “Es fascinante, significa que el robot puede averiguar qué hacer con una herramienta en situaciones que no había visto antes. Queremos estudiar este escenario, en vez de tener a un robot aprendiendo como usar una herramienta”.
Los investigadores ya habían demostrado a un robot que aprendió a mover objetos sin instrucciones explícitas. Mediante la observación y la experimentación, el robot desarrolló un modelo simple de causa y efecto (“Si se empuja un objeto de esta manera terminará ahí”). El nuevo robot aprende de una manera similar, pero construye un modelo más complejo del mundo físico (“Mover este elemento puede mover esos otros elementos hacia allá”).
El sistema robótico aprende de varias maneras. Para obtener una comprensión básica de la causa y el efecto, experimenta con los objetos por su cuenta y los empuja para ver qué pasa. También se alimenta de datos de mucho aprendizaje robótico anterior. Durante todo ese tiempo, una red neuronal recurrente aprende a predecir qué pasaría si el robot realiza una acción concreta.
Para dominar el uso de las herramientas, el robot también observa el comportamiento humano. Al combinar la información recibida por los dos tipos de aprendizaje, la máquina puede determinar cómo usar un objeto en una situación nueva.
La estudiante de pregrado de Berkeley involucrada en este proyecto, Annie Xie, escribe sobre este trabajo en una publicación de un blog: “Con una combinación de datos de demostración y experiencia no supervisada, un robot puede usar objetos nuevos como herramientas e incluso improvisar con algunas herramientas en la ausencia de las tradicionales”.
Levine, como investigador experto en el aprendizaje robótico, afirma que quedó sorprendido por la capacidad del robot para improvisar. En una ocasión, por ejemplo, el robot decidió que una botella de agua, debido a su forma y tamaño, podría usarse para barrer. “Cuando observa cosas que no son herramientas, podría encontrar unas formas sorprendentes de usarlas”, concluye Levine.
Fuente: technologyreview.es