RoboNet: así es la primera ‘universidad’ gratuita para cualquier robot
Uno de los héroes olvidados de la revolución de la inteligencia artificial (IA) es una base de datos poco conocida llamada ImageNet. Creada por investigadores de la Universidad de Princeton (EE. UU.), ImageNet contiene alrededor de 14 millones de imágenes, cada una de ellas acompañada de un texto colaborativo que explica qué aparece en la imagen.
Su importancia radica en que es la base de datos con la que se han entrenado muchas de las redes neuronales más poderosas de de la actualidad. Las redes neuronales aprenden mirando las imágenes y el texto que las acompaña. Cuanto más grande sea la base de datos, más aprenden. Sin ImageNet y otros conjuntos de datos visuales como este, ni siquiera las redes neuronales más potentes serían capaces de reconocer nada.
Ahora los expertos en robótica afirman que quieren probar un enfoque similar, pero con vídeos. El objetivo es enseñar a sus máquinas cómo interactuar con el entorno. El investigador de la Universidad de California en Berkeley (EE. UU.) Sudeep Dasari y sus colegas están creando una base de datos llamada RoboNet, compuesta por vídeos y sus explicaciones sobre robots en acción. Por ejemplo, los datos pueden incluir numerosas escenas de un robot que mueve una taza sobre una mesa. La idea es que cualquiera pueda descargar estos datos y usarlos para entrenar una red neuronal llegar a cabo la misma acción, aunque la máquina nunca haya interactuado con una taza.
Dasari y sus compañeros esperan que RoboNet se convierta en un recurso con el que se pueda entrenar a casi cualquier robot para realizar casi cualquier tarea. Para sus creadores, sería como una especie de universidad para robots.
Hasta ahora, los expertos en robótica han tenido un éxito limitado a la hora de enseñar a sus robots cómo navegar e interactuar con el entorno. Su enfoque se basa en la técnica estándar de aprendizaje automático que ImageNet ayudó a popularizar. El proceso comienza con grabaciones de robots interactuando con, por ejemplo, un cepillo que va moviendo por una superficie. Luego, los investigadores toman muchos más vídeos de sus movimientos y usan los datos para entrenar a una red neuronal sobre la mejor forma de realizar esa acción.
El truco consiste en tener muchos datos, claro está; en otras palabras, en disponer de innumerables horas de vídeo de las que aprender. Y cuando el robot logra dominar el movimiento del cepillo, debe pasar por el mismo proceso aprender a mover casi cualquier otro objeto, ya sea una cuchara o unas gafas. Si el entorno cambia, estos sistemas de aprendizaje deben empezar de nuevo.
“La práctica común de volver a recoger datos desde cero para cada nuevo entorno implica volver a aprender los conocimientos básicos sobre el mundo, y eso es un esfuerzo innecesario”, opina Dasari. RoboNet evita esto. Su responsable detalla: “Proponemos RoboNet, una base de datos abierta para compartir experiencias robóticas”. De esta forma, cualquier robot puede aprender de la experiencia de otro.
Para poner en marcha la base de datos, el equipo ya ha grabado unos 15 millones de fotogramas de vídeo de tareas ejecutadas por siete tipos de robots diferentes, con distintas pinzas de agarre y en una variedad de entornos. Los investigadores también explican cómo usar esta base de datos para entrenar a los robots para tareas que nunca antes habían intentado. Y sostienen que las máquinas entrenadas con este enfoque funcionan mejor que las que han sido entrenadas de forma convencional, incluso con más datos.
Los datos de RoboNet están disponibles para cualquiera pueda usarlos. Y, por supuesto, Dasari y sus colegas esperan que otros equipos de investigación empiecen a aportar sus datos para que RoboNet se convierta en un gran recurso de aprendizaje automático.
Se trata de un logro impresionante con un importante potencial. “Este trabajo da el primer paso hacia la creación de agentes robóticos capaces de operar en una amplia gama de entornos y con hadrware diferente”, explica el equipo. Por supuesto, existen grandes desafíos por delante. Por ejemplo, los investigadores deben determinar cuál es la mejor manera de utilizar los datos: aún no está claro cuál es el régimen más efectivo de entrenamiento. Dasari concluye: “Esperamos que RoboNet inspire a las comunidades de robótica y aprendizaje reforzado a investigar cómo escalar los algoritmos de aprendizaje reforzado para satisfacer la complejidad del mundo real”.
Su trabajo resulta impresionante y estimulante: una especie de universidad de robots que puede dar a cualquier máquina las habilidades que necesita para aprender. ImageNet ha sido un elemento clave para que la visión artificial se haya vuelto tan buena para reconocer objetos. Si RoboNet consigue solo la mitad de su éxito, será un logro impresionante.
Fuente: technologyreview.es