jueves, diciembre 07, 2017

AlphaZero derrota a Stockfish, 100 años de conocimiento superados en un día

Lograr la maestría en ajedrez jugando contra ti mismo, parece algo difícil de creer, sin embargo un grupo de científicos lo logró con un algoritmo general de aprendizaje.

El resultado, es el más sorprendente en la historia del ajedrez y probablemente para muchas de las ciencias conocidas: Alphazero aprendió en un día jugando contra si mismo las leyes que rigen actualmente al ajedrez e incluso puede ser que supero el conocimiento que se tenía, asignando nuevas valoraciones a temas conocidos como la pareja de alfiles.

Alphazero, de acuerdo a los artículos consultados es un programa o software que se instala en una computadora, el cual tiene lo que se conoce como inteligencia artificial. Pertenece a una empresa financiada por Google.

El ajedrez ha sido ampliamente estudiado por la inteligencia artificial, pero nunca antes se había obtenido un resultado como este.  Los programas de ajedrez actualmente han desarrollado un nivel de juego que puede superar fácilmente al campeón del mundo Magnus Carlsen, para lo cual contaron con la ayuda de bases de datos de partidas humanas así como del conocimiento que en más de 100 años se ha estado apropiando el humano.

Este suceso podría compararse al que se suscitó hace 20 años cuando el campeón del mundo Garry Kasparov fue derrotado por lo que entonces fue una supercomputadora, Deep Blue. Lo que es más impresionante en este momento es la forma en que Alphazero derrotó a Stockfish 8 uno de los 3 programas de ajedrez más potentes que existen, de 100 partidas jugadas gano 25 y empato 75, con ninguna derrota.

Un dato interesante, es que en este primer artículo publicado sobre la elección de aperturas de Alphazero, se encuentran el gambito de dama y la apertura inglesa, descartando después de su experiencia en el juego las aperturas abiertas con e4.

Este es el PGN de las  partidas 5 y 9 que más impresión han causado entre los GM de la Elite mundial,  pueden descargarlas y comparar la valoración que hace su programa de ajedrez:


Al final agrego dos enlaces recomendables donde se puede conocer más información sobre el tema así como el vínculo donde se encuentra publicado el artículo científico completo.

Fuentes consultadas:

3.- Artículo completo: Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm. https://arxiv.org/pdf/1712.01815.pdf. Consultado el 07-12-2017.





No hay comentarios.: