AlphaZero: El futuro está aquí

Georgina Hernández Montes

RAI-UNAM

La Dra. Georgina Hernández Montes es Química Farmacobióloga egresada de la Facultad de Química de la UNAM. Actualmente es parte de la Red de Apoyo a la Investigación (RAI) de la UNAM y se ha especializado en el área de bioinformática.

Esta publicación fue revisada por el comité editorial de la Academia de Ciencias de Morelos.

Durante siglos el ajedrez se ha jugado en tableros físicos, pero con el desarrollo de la informática, algunos destacados matemáticos e ingenieros como Charles Babbage, Alan Turing, Claude Shannon y John von Neumann que diseñaron hardware, algoritmos y teoría para jugar en una computadora, pero también para analizar este ancestral juego. A partir de entonces, el ajedrez se ha convertido en un gran desafío en las ciencias de la computación y para una generación de investigadores y programadores en dicha área. Sin embargo, los estudios relacionados con el ajedrez tuvieron su primer momento cumbre en 1997 cuando DeepBlue, una supercomputadora desarrollada por la compañía IBM, derrotó al entonces campeón del mundo Garry Kasparov. Este resultado, aunque muy sorprendente, era de esperarse ya que DeepBlue contaba con grandes ventajas a diferencia de un jugador humano: 1) podía evaluar 200 millones de posiciones por segundo; 2) nunca cometió errores de cálculo y 3) nunca olvidó lo que había calculado un momento antes. Este fue el inicio de una nueva era en donde se buscaba desarrollar programas de ajedrez de alto rendimiento que se desempeñarán a nivel sobrehumano, actualmente hay dos motores muy sobresalientes Stockfish y Komodo.

¿Por qué el ajedrez es un modelo tan interesante?

La mayoría de los historiadores concuerdan en que el ajedrez (Figura 1) fue creado en la India alrededor del siglo VI. Las leyendas cuentan que en la antigua Asia, un rey estaba tan fascinado por la creación del ajedrez, que le ofreció al inventor del juego, (en algunas historias un matemático en otras un sabio), el derecho de elegir su recompensa. Este le pidió un premio que al rey le pareció muy modesto. Deseaba recibir un grano de trigo por la primera casilla, dos por la segunda y cuatro por la tercera, duplicando la cantidad de la casilla anterior cada vez, en cada una de las 64 casillas. El rey pidió al tesorero de la corte que entregar la recompensa solicitada por el inventor. Pero cual fue la sorpresa del rey al ser notificado que no era posible entregar la recompensa al creador del ajedrez, ya que no había trigo suficiente el reino para cubrir la cantidad solicitada. De hecho, ni con la producción histórica de trigo en el mundo, se podría pagar esta deuda.

A pesar de que las 64 casillas del tablero de ajedrez ocupan un espacio pequeño y finito, ofrecen tantas posibilidades y combinaciones. La humanidad, ha necesitado miles de años para perfeccionar las jugadas, y aun así no se ha llegado nunca a la partida perfecta.

A principios de diciembre de 2018, Demis Hassabis director y fundador de DeepMind, una compañía de inteligencia artificial propiedad de la empresa Google y su grupo de investigación publicaron en la revista Science un algoritmo de aprendizaje automático que domina no solo el ajedrez, sino también el Shogi o ajedrez japonés y el Go un juego de estrategia mucho más complejo que el ajedrez. El algoritmo llamado AlphaZero comenzó sin conocimiento de los juegos, solamente se le proporcionaron las reglas básicas de cada uno.

¿En qué se diferencia la estrategia de motores como DeepBlue o Stockfish de AlphaZero? Los primeros motores de ajedrez fueron programados con los principios básicos del juego, principios que han sido perfeccionados a lo largo de décadas por los grandes maestros del ajedrez, pero no son capaces de comprender el juego y por lo tanto están limitados a la información que se les ha alimentado. Por lo tanto, su estilo de juego está basado más en velocidad y poder de cómputo, que en creatividad.

Por otra parte, AlphaZero es un programa de inteligencia artificial que solamente fue alimentado con las reglas del ajedrez, por lo que descubrió los principios del ajedrez por su cuenta. Su entrenamiento consistió en jugar contra sí mismo millones de veces para así “aprender” de sus errores. En un periodo de 9 horas se convirtió en el mejor jugador de todos los tiempos. Su estrategia es jugar contra sí mismo y actualizar su red neuronal a medida que aprendía de la experiencia.

Al competir contra los motores existentes de ajedrez, AlphaZero fue absolutamente superior a ellos. Aplastó a Stockfish, el actual campeón mundial de ajedrez en computadoras. En un torneo de cien partidos, AlphaZero obtuvo veintiocho victorias y setenta y dos empates. No perdió un solo juego. Lo más sorprendente es que AlphaZero ganó “pensando” de manera más inteligentemente, no más rápido; examinó solo 60 mil posiciones por segundo, en comparación con 60 millones que analizó Stockfish, esto en un tiempo 4 horas.

Lo mismo sucedió cuando le dieron las reglas de Shogi y de Go. Tardó 12 horas en aprender Shogi y 2 en derrotar al motor campeón (Elmo), mientras que aprender Go le llevo 13 días y derrotar al programa líder le tomó 30 horas.

Inteligencia Artificial, su historia y aplicaciones

Si usted estimado lector o lectora ha llegado hasta aquí, seguramente se preguntará qué importancia puede tener esto en nuestra vida cotidiana. Y la respuesta es que el aprendizaje automático promete ayudarnos a resolver cuestiones mucho más importantes tales como: encontrar cura para los diferentes tipos de cáncer, los enigmas del sistema inmunológico, los misterios del genoma o de la conciencia (Figura 2). Antes de explicar qué aportaciones concretas nos puede proporcionar el aprendizaje automático, es importante saber qué es y cómo funciona.

La inteligencia artificial (IA) como campo surgió en la década de 1960, cuando los profesionales de la ingeniería y las ciencias cognitivas comenzaron a colaborar para desarrollar tecnologías computacionales que, como las personas, pudieran realizar tareas como detección de patrones, el aprendizaje, el razonamiento y la acción. Los primeros sistemas de inteligencia artificial dependían en gran medida de reglas derivadas de expertos para replicar cómo las personas abordarían estas tareas. El aprendizaje automático, que es un subcampo de la IA, surgió cuando la investigación comenzó a aprovechar las técnicas numéricas que integran los principios de computación, optimización y estadísticas para “aprender” automáticamente los programas para realizar estas tareas mediante el procesamiento de datos y de aquí el gran interés que se generó por trabajar con los grandes datos o Big Data.

Actualmente existen varias aplicaciones que han arrojado resultados alentadores. En agosto pasado, dos artículos en la revista científica Nature Medicine exploraron cómo el aprendizaje automático podría aplicarse al diagnóstico médico. En el primer caso fue una aplicación en oftalmología, ya que al igual muchas otras especialidades sufre de una severa escasez de especialistas que sean capaces de interpretar los millones de escaneos del iris para realizar diagnósticos. En este caso los investigadores de DeepMind se unieron a los médicos del Moorfields Eye Hospital en Londres para desarrollar un algoritmo de aprendizaje profundo que pudiera clasificar una amplia gama de patologías retinales con la mayor precisión que los expertos humanos.

En el otro estudio fue diseñado para apoyar a los neurólogos, en este caso se desarrolló a un algoritmo de aprendizaje automático que decide si una tomografía computarizada de una sala de urgencias el paciente muestra signos de un derrame cerebral, una hemorragia intracraneal u otro evento neurológico crítico. Para los pacientes de accidentes cerebrovasculares, cada minuto importa. Cuanto más se retrasa el tratamiento, peor es el resultado. El nuevo algoritmo pudo distinguir estos y otros eventos críticos con una precisión comparable a la de los expertos humanos, pero lo hizo 150 veces más rápido. Esto permitiría que los casos más urgentes se atiendan antes, por un radiólogo humano.

Otro algoritmo interesante es el utilizado por Watson para Oncología (WFO), un programa desarrollado por IBM y que es capaz de hacer diagnósticos y proporcionar un tratamiento para cáncer de mamá. El programa se alimentó con un conjunto de recursos seleccionados que incluyen textos de más de 300 revistas médicas y libros de texto, guías de tratamiento desarrolladas según los estándares nacionales de tratamiento y la experiencia clínica de hospitales. También se clasificaron los datos de más de 550 casos de cáncer de mama, incluidas las características y las comorbilidades del paciente, el estado funcional, las características y el estadio del tumor, las imágenes y otras pruebas de laboratorio. En primer lugar, se le enseñó a analizar los casos que se usan para capacitar a los médicos sobre el cáncer de mama para proporcionar recomendaciones de tratamiento basadas en la evidencia. Después los especialistas revisaron y calificaron las recomendaciones de la WFO para refinar su proceso analítico. Las opciones de tratamiento que generó WFO (que generalmente incluyen varias opciones para un solo caso) son congruentes con los tratamientos propuestos por los médicos en más del 80% de las veces.

En cuanto al campo de la prevención, se han reportado algunos casos interesantes, en el primero un grupo de investigadores consideraron la posibilidad de reducir las complicaciones y la mortalidad dentro de los 30 días posteriores a las cirugías particulares. Utilizando datos de aproximadamente 88,000 estudios utilizaron datos como la edad, raza, sexo, medicamentos e historia de comorbilidad de un paciente para determinar el riesgo de complicaciones o muerte después de la cirugía. En general, las tasas de complicaciones postquirúrgicas fueron 16.0% para cualquier complicación en 30 días y 0.51% para muertes en 30 días. En este caso su algoritmo logró determinar con exactitud 1 de cada 3 casos que podrían presentar complicaciones.

En otro estudio un grupo de investigadores diseñó un algoritmo para predecir la progresión de la miopía. Utilizaron datos clínicos de aproximadamente 130,000 personas de 6 a 20 años derivadas de los sistemas de registros médicos electrónicos en 8 centros oftálmicos de 2005 a 2015. Con este algoritmo han sido capaces de predecir el inicio de la enfermedad en edades tan tempranas como 8 años. Este estudio está en espera para su evaluación en estudios prospectivos para determinar si las intervenciones clínicas o de comportamiento pueden retrasar la progresión de la miopía en niños en edad escolar de alto riesgo.

Otra de las aplicaciones que favorecerán el desarrollo de la medicina de precisión es la agrupación eficiente de las diferentes enfermedades. Las definiciones de enfermedades y subtipos de enfermedades que utilizamos hoy se basan en gran medida en las descripciones basadas en síntomas originales ofrecidas en el siglo XVII por Sydenham y Linneo y en las definiciones basadas en órganos desarrolladas por Osler en el siglo XX. Con el aprendizaje automático es posible ir más allá, como lo demostraron, Adnan Custovic al aplicar estos programas a la subagrupación del asma y la alergia. Los investigadores lograron identificar nuevos fenotipos de atopia infantil y en un estudio más refinado identificaron grupos de sensibilización de inmunoglobulina E específica para cada componente (IgE).

Como hemos visto la Inteligencia artificial nos presenta un panorama muy alentador sobre todo para la medicina de precisión (Figura 3). Sin embargo, no está exento de tener riesgos y limitaciones. En primer lugar, está el hecho de que estas tecnologías están siendo desarrolladas por empresas ya de por sí muy poderosas como los son Google y Amazon quienes podrían limitar el acceso a estas tecnologías y generar aún más de desigualdad.

Por otro lado, están las características propias de estos sistemas, los algoritmos del aprendizaje automático no son capaces de explicarse, por ejemplo, AlphaZero da la impresión de haber descubierto algunos principios importantes sobre el ajedrez, pero no puede compartir esa comprensión con nosotros, al menos no todavía. Como no sabemos por qué funcionan, no podemos confiar plenamente en ellos, y es por eso por lo que su implementación sobre todo en sistemas de salud debe ser realizar con mucho rigor porque tendrán en sus manos o mejor dicho en sus algoritmos tareas fundamentales como la salud de muchos pacientes.

Esta columna se prepara y edita semana con semana, en conjunto con investigadores morelenses convencidos del valor del conocimiento científico para el desarrollo social y económico de Morelos. Desde la Academia de Ciencias de Morelos externamos nuestra preocupación por el vacío que genera la extinción de la Secretaría de Innovación, Ciencia y Tecnología dentro del ecosistema de innovación estatal que se debilita sin la participación del Gobierno del Estado.

Lecturas recomendadas

https://www.abc.es/ciencia/abci-inteligencia-artificial-alphazero-juega-y-aprende-como-superhombre-201812062117_noticia.html

Referencias

https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1002721

Fuente: Academia de Ciencias de Morelos