sliderTecnología

Un algoritmo aprende solo a hacer el cubo de Rubik en 20 movimientos

Un algoritmo ha demostrado ser capaz de completar el cubo de Rubik más deprisa que cualquier humano: aproximadamente en 20 movimientos frente a 50. Y ha aprendido a hacerlo solo.

El sistema de inteligencia artificial creado por investigadores de la Universidad de California Irvine (UCI) –denominado DeepCubeA– es un algoritmo de aprendizaje de refuerzo profundo que puede encontrar la solución para organizar un cubo de Rubik en una fracción de segundo, sin ningún conocimiento de dominio específico o entrenamiento en el juego por parte de los humanos.

Esta no es una tarea sencilla, ya que el cubo tiene caminos de finalización numerados en miles de millones, pero solo un estado objetivo, cada uno de los seis lados que muestra un color sólido, que aparentemente no se puede encontrar a través de movimientos aleatorios, según explican los creadores del algoritmo, que publican su trabajo en Nature Machine Intelligence.

DeepCubeA resolvió el 100 por ciento de todas las configuraciones de prueba, encontrando el camino más corto hacia el estado de la meta aproximadamente el 60 por ciento de las veces. El algoritmo también funciona en otros juegos combinatorios como el rompecabezas de baldosas deslizantes, Lights Out y Sokoban.

“La inteligencia artificial puede derrotar a los mejores jugadores humanos de ajedrez y Go del mundo, pero algunos de los rompecabezas más difíciles, como el Cubo de Rubik, no se resolvieron con las computadoras, por lo que pensamos que estaban abiertos para los enfoques de la IA (Inteligencia Artificial)”, dijo el autor principal Pierre Baldi, distinguido profesor de informática de la UCI. “La solución para el Cubo de Rubik implica un pensamiento más simbólico, matemático y abstracto, por lo que una máquina de aprendizaje profundo que puede resolver este enigma se está acercando a convertirse en un sistema que puede pensar, razonar, planificar y tomar decisiones”.

Los investigadores estaban interesados en comprender cómo y por qué la IA realizó sus movimientos y cuánto tiempo llevó perfeccionar su método. Comenzaron con una simulación por computadora de un rompecabezas completado y luego mezclaron el cubo. Una vez que el código estuvo en su lugar y funcionando, DeepCubeA se entrenó por separado durante dos días, resolviendo una serie de combinaciones cada vez más difíciles. “Aprendió por sí solo”, señaló Baldi.

Hay algunas personas, particularmente adolescentes, que pueden resolver el Cubo de Rubik a toda prisa, pero incluso necesitan aproximadamente 50 movimientos.

“Nuestra IA necesita alrededor de 20 movimientos, la mayoría de las veces resolviéndolos en la cantidad mínima de pasos”, dijo Baldi. “Justo allí, puedes ver que la estrategia es diferente, así que mi mejor conjetura es que la forma de razonamiento de la IA es completamente diferente a la de un humano”.

El científico informático veterano dijo que el objetivo final de proyectos como este es construir la próxima generación de sistemas de inteligencia artificial. Ya sea que lo sepan o no, la inteligencia artificial afecta a las personas todos los días a través de aplicaciones como Siri y Alexa y los motores de recomendación que trabajan detrás de la escena de sus servicios en línea favoritos.

“Pero estos sistemas no son realmente inteligentes; son frágiles, y uno puede romperlos o engañarlos fácilmente”, dijo Baldi. “¿Cómo creamos una IA avanzada que sea más inteligente, más robusta y capaz de razonar, comprender y planificar? Este trabajo es un paso hacia esta gran meta”.

Fuente: EP