L’intégralité des connaissances liée aux jeux des échecs a été absorbée en 4 heures par une intelligence artificielle
Selon le grand maître des échecs danois, Peter Heine Nielsen, dans une récente interview pour la BBC :
Je me suis toujours demandé comment cela se passerait si une espèce supérieure débarquait sur Terre et nous montrait comment elle jouait aux échecs.
Maintenant je sais…
Le jeu d’échecs n’est pas un jeu facile, selon les standards humains. Mais pour une intelligence artificielle, pourvue d’un formidable “état d’esprit”, presque extraterrestre, la domination du plateau (échiquier) peut être maîtrisée en quelques heures.
Dans une nouvelle étude, les chercheurs de Google détaillent comment leur dernière version de l’intelligence artificielle, AlphaZero, a développé des « performances surhumaines » dans le domaine des échecs, ne prenant que quatre heures pour apprendre les règles avant d’annihiler le champion du monde d’échecs.
En d’autres termes, toute la connaissance des échecs de l’humanité, et au-delà, a été absorbée et dépassée par une IA, en à peu près autant de temps qu’il n’en faut pour faire un Paris-Lyon ou Bruxelle-Paris ou Calgary-Edmonton (parce qu’il y a aussi des Canadiens qui lisent le Guru…) en voiture.
Après avoir été programmé avec les règles du jeu d’échecs (sans les stratégies), en seulement quatre heures, AlphaZero maîtrisait le jeu dans la mesure où il était capable de battre le meilleur programme d’échecs, Stockfish.
Dans une série de 100 parties contre Stockfish, AlphaZero a remporté 25 matchs en jouant avec les blancs (avec l’avantage du premier mouvement) et 3 matchs en jouant avec les noirs. Le reste fut des matchs nuls, Stockfish n’ayant remporté aucune victoire et AlphaZero n’ayant subi aucune défaite.
Selon le chercheur spécialisé dans les échecs, David Kramaley, PDG du site Chessable :
Nous savons maintenant qui est notre nouveau maitre. Cela va sans aucun doute révolutionner le jeu, mais réfléchissez à la façon dont cela pourrait être appliqué en dehors des échecs. Cet algorithme pourrait gérer des villes, des continents, des univers.
Développé par le laboratoire DeepMind AI de Google, AlphaZero est une version améliorée et générique d’AlphaGo Zero, spécialisée et grand vainqueur du jeu de plateau chinois Go.
DeepMind a affiné cette IA pendant des années, et dans le même temps elle a vaincu une série de champions humains qui sont tombés comme des dominos devant l’invincible réseau de neurones.
Cette série de victoires a trouvé son paroxysme avec une victoire saisissante en octobre, quand une nouvelle version entièrement autonome de l’IA, qui apprend seulement en jouant par elle-même, ne faisant jamais face aux humains, a surpassé toutes ses anciennes incarnations. A la différence de cette version, les prédécesseurs d’AlphaGo Zero ont en partie appris à jouer au jeu en observant les mouvements effectués par des joueurs humains, mais il semble que cela ait pu être un handicap, puisque l’apprentissage entièrement autonome d’AlphaGo Zero s’est avéré terriblement plus efficace dans une compétition individuelle.
Pour l’informaticien Nick Hynes du MIT :
C’est comme une civilisation extraterrestre qui invente ses propres mathématiques.
Ce que nous voyons ici est un modèle libéré des présuppositions et des erreurs humaines. Il peut apprendre tout ce qu’il estime être optimal, ce qui peut en effet être plus nuancé que nos propres conceptions de la même chose.
Mais les choses avancent si vite dans ce domaine que sa victoire d’octobre a peut-être déjà été dépassée.
Dans son nouveau document de recherche, l’équipe explique comment la toute dernière IA AlphaZero prend son indépendance dans le jeu, un processus/ algorithme appelé « reinforcement learning » (Apprentissage par renforcement) et l’applique avec une série beaucoup plus généralisée qui lui donne une approche plus globale de la résolution des problèmes. Cette « focalisation plus large » signifie qu’AlphaZero ne se contente pas que des échecs. Il joue aussi à Shogi (le nom du jeu d’échecs japonais) et au jeu de Go aussi et, sans véritable surprise, cela ne lui a pris que 2 et 8 heures respectivement pour maîtriser ces jeux.
Pour l’instant, les informaticiens de Google et DeepMind n’ont pas commenté publiquement la nouvelle recherche, qui n’a pas encore été évaluée par les pairs. Mais selon les performances atteintes jusqu’à présent, l’ascension vertigineuse de cet algorithme à la pointe de l’intelligence artificielle est loin d’être terminée et les grands maîtres d’échecs sont déconcertés par ce qui les attend.
L’étude au format PDF disponible en pré-publication sur ArXiv : Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm.
Faire un Don !
Bonjour,
Correction au 4ème paragraphe : AlphaZero n’a pas battu le champion du monde d’échecs, puisqu’il n’a pas joué contre un humain à ce jour. Mais il a bien battu un des meilleurs logiciels, comme dit dans l’article.