Lo que hemos aprendido de AlphaGo

Primero que nada, ¿Qué es AlphaGo?

AlphaGo es un programa informático de inteligencia artificial desarrollado por Google DeepMind para jugar al juego de mesa Go. En octubre de 2015 se convirtió en la primera máquina de Go en ganar a un jugador profesional de Go sin emplear piedras de handicap en un tablero de 19×19.

 

Hay que mencionar que AlphaGo no sólo es un juego, para algunos es la vida y la cultura de jugadores y analistas.

AlphaGo

Durante los últimos 10 días en Seúl, Corea del Sur, hemos tenido la suerte de presenciar un poco de ese entusiasmo increíble de primera mano. También hemos tenido la oportunidad de ver algo que nunca ha ocurrido antes: AlphaGo de DeepMind asumió y derrotó al  legendario jugador de go, Lee Sedol (con 9 grado profesional y 18 títulos mundiales), que marca un hito importante para la inteligencia artificial.

Los peatones pudieron observar el encuentro entre el AlphaGo contra Lee Sedol en las calles de Seúl el 13 de marzo.

Go puede ser uno de los juegos más antiguos que existen, pero la atención a nuestro torneo de cinco partidos superó incluso nuestras ideas más descabelladas.

En China, decenas de millones observaban en vivo los partidos, y el hashtag “El hombre v/s La máquina Go arreglo de cuentas” se vio en 200 millones de páginas en Sina Weibo. Las ventas de tableros Go incluso aumentó en Corea.

Nuestra prueba pública de AlphaGo, sin embargo, era algo más que ganar en Go. Fundamos DeepMind en 2010 para crear inteligencia artificial de uso general (IA), que pueda aprender por sí misma y, finalmente, ser utilizado como una herramienta para ayudar a la sociedad a resolver algunos de sus problemas más importantes y urgentes, desde el cambio climático hasta el diagnóstico de enfermedades.

Al igual que muchos investigadores que se nos presentan, hemos estado desarrollando y probando nuestros algoritmos a través de juegos.

AlphaGo el primer programa de (IA) nos reveló por primera vez que podría vencer a un jugador profesional en el más complejo juego de mesa que la humanidad ha ideado, utilizando el aprendizaje profundo y el aprendizaje por refuerzo.

El último desafío para AlphaGo era competir contra el mejor jugador de go de la década pasada-Lee Sedol.

Para sorpresa de todos, incluido el nuestro, AlphaGo ganó cuatro de los cinco juegos. Los comentaristas señalaron que AlphaGo jugo sin precedentes, fue creativo, e incluso hizo “bellos”movimientos.

En base a los datos, AlphaGo realizó un atrevido movimiento en la jugada 37 del juego 2; ese movimiento tenía una probabilidad de 1 en 10.000 de ser jugada por un ser humano. Lee respondió con movimientos innovadores de su elección,  AlphaGo volvio a hacer una de estas jugadas en el movimiento 78 en el juego 4, con una probabilidad de 1 en 10.000 de ser jugado por un ser humano, que finalmente resultó en una victoria. El resultado final fue de 4-1. Con una contribución de $1 millón en premios a las organizaciones que apoyan la educación (STEM) ciencia, tecnología, ingeniería y matemáticas y Go, así como el UNICEF.

Hemos aprendido dos cosas importantes de esta experiencia. En primer lugar, esta prueba es un buen augurio para el potencial de (AI) en la solución de otros problemas. AlphaGo tiene la capacidad de mirar de manera “global” a través de un tablero y encontrar soluciones que los seres humanos o bien han sido entrenados para no jugar o no tienen idea que existen. Esto tiene un enorme potencial para el uso de la tecnología AlphaGo para encontrar soluciones que los seres humanos no necesariamente ven en otras áreas. En segundo lugar, mientras que el partido ha sido ampliamente considerado como el “hombre contra la máquina,” AlphaGo es realmente un logro humano.

Pero como se suele decir acerca de Go en coreano: “No seas arrogante cuando ganas o se va a perder tu suerte.” Esto es sólo un pequeño, pero significativo, paso en el camino para hacer máquinas inteligentes. Hemos demostrado que nuestras técnicas de aprendizaje de refuerzo y de vanguardia pueden ser utilizados para hacer fuertes jugadores de Go y Atari. Redes neuronales profundas ya se utilizan en Google para tareas específicas como el reconocimiento de imágenes, reconocimiento de voz y de búsqueda ranking. Sin embargo, todavía estamos muy lejos de que una máquina pueda aprender a realizar de forma flexible la gama completa de tareas intelectuales que un ser humano puede o mejor dicho una verdadera inteligencia artificial.

Entradas relacionadas

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *