Sélectionner une page

L’intelligence artificielle de Google n’a même plus besoin des humains pour les surpasser au jeu de go

19 Oct 2017 | 1 commentaire

Go-deepmind

L‘intelligence artificielle (IA) AlphaGo de Google DeepMind, qui avait déjà battu l’humain au jeu de go, est devenue encore plus intelligente. Le dernier système de l’entreprise a non seulement battu toutes les précédentes versions du logiciel, mais il l’a fait tout seul.

Selon Demis Hassabis, PDG et cofondateur de DeepMind :

La chose la plus frappante pour moi est que nous n’avons plus besoin de données humaines.

Alors que la première version d’AlphaGo devait être formée à partir des données de plus de 100 000 parties humaines, l’AlphaGo Zero peut apprendre à jouer à partir d’une « feuille blanche ». DeepMind a non seulement éliminé le besoin initial d’une entrée de données humaines, mais Zero est également capable d’apprendre plus vite que son prédécesseur.

David Silver, le principal programmeur du projet Go de DeepMind, affirme que l’AlphaGo qui avait battu le champion du monde (18 fois) Lee Sedol 4-1 a demandé plusieurs mois d’entraînement.

Nous avons atteint un niveau de performance supérieur après seulement 72 heures d’entraînement avec l’AlphaGo Zero.

Seulement 4,9 millions de jeux simulés ont été nécessaires pour former Zero, par rapport aux 30 millions d’origine de l’AlphaGo. Après trois jours d’apprentissage, Zero a réussi à vaincre la version de Lee Sedol, 100-0. Après avoir joué pendant 40 jours, Zero a battu la version la plus puissante d’AlphaGo de DeepMind, appelée Master, qui a battu le maître chinois Ke Jie en mai.

Pour Satinder Singh, directeur du laboratoire IA de l’université du Michigan :

Zero surpasse massivement l’AlphaGo déjà surhumain et pourrait être l’une des plus grandes avancées de l’IA jusqu’à maintenant.

Quand AlphaGo Zero a commencé à jouer contre lui-même, il ne lui a été présenté qu’un ensemble de règles, un plateau et les pions blancs et noirs. Il ne savait pas quelles stratégies, mouvements ou tactiques seraient nécessaires pour gagner. « Les seules ressources nécessaires sont les pierres noires et blanches du plateau », selon Silver, ajoutant qu’il croit que l’entreprise pourrait créer un système capable d’apprendre les règles du jeu.

Un goban traditionnel, plateau du jeu de go, avec des pierres noires et blanches. (Wikipédia)

Go_game

Dès le début, à partir du moment où Zero a reçu les règles, le système a joué des parties contre lui-même. Pendant ce temps, il apprend les mouvements qu’il peut faire et qui le conduiront à une victoire. Pour que DeepMind améliore son système déjà couronné de succès et parvienne à ce résultat, il a dû refaire les algorithmes utilisés dans l’IA.

Le processus global utilise un algorithme d’apprentissage par renforcement combiné avec un système de recherche. Pour faire simple, cela signifie que Zero apprend par des essais et des erreurs et peut utiliser son système de recherche pour évaluer chaque mouvement potentiel.

Lorsque Zero a joué un match contre lui-même, il a reçu des rétroactions du système. Un +1 est donné s’il gagne et un -1 s’il perd. Après chaque partie, le réseau neuronal du Zero se reconfigure automatiquement en une nouvelle version, théoriquement meilleure. En moyenne, le système prenait 0,4 seconde de réflexion avant de réaliser un mouvement.

Le nouveau système utilise un seul réseau neuronal au lieu des deux et quatre des processeurs AI de Google, par rapport aux 48 nécessaires pour battre Lee. Au cours du développement de Zero, Hassabis affirme que le système a été formé sur du matériel qui a coûté près de 35 millions de dollars (29 millions d’Euros) à l’entreprise. Le matériel est également utilisé pour d’autres projets DeepMind.

Dans le développement de Zero, DeepMind a été capable de faire plus… avec moins. Dans ses tests en internes, la firme affirme que Zero a pu battre toutes ses précédentes versions : AlphaGo Master, AlphaGo Lee, AlphaGo Fan, Crazy Stone, Pachi et GruGo. Silver ajoute que Zero n’a pas atteint son niveau maximal possible de connaissance, mais uniquement parce que l’équipe a cessé de travailler sur le projet.

L’étude conclut :

Il est possible de l’entraîner à un niveau surhumain, sans exemples ni conseils humains, sans connaissance du domaine au-delà des règles de base.

Le système a appris les mouvements et les tactiques humaines communes et les a complétés avec ses propres et ses plus efficaces mouvements.

Comme pour la victoire de Deep Blue contre le grand maître des échecs Gary Kasparaov en 1996, le succès continu de DeepMind au jeu de Go a des implications plus larges.

Mais aussi avancé soit Zero, il ne peut être appliqué à n’importe quel problème et le résoudre.

Selon M. Singh :

Pris ensemble, les résultats suggèrent que les IA fondées sur l’apprentissage par renforcement peuvent être bien meilleures que celles qui reposent sur l’expertise humaine. Le système, par exemple, ne pouvait pas être utilisé pour traduire des langues.

Pour Hassabis et ses collègues, le défi permanent consiste à appliquer ce qui a été appris dans le cadre du projet AlphaGo à d’autres problèmes d’intelligence artificielle avec des applications dans le monde réel.

Nous avons essayé de concevoir l’algorithme pour qu’il puisse jouer, en principe, à d’autres jeux appartenant à une classe similaire (incluant les échecs) et plus généralement aux domaines de la planification.

Cela inclut le repliement des protéines, la découverte de médicaments, la conception de matériaux et la chimie quantique. Une partie de la résolution de ces problèmes réside dans la capacité à créer des simulations de résultats potentiels. Le jeu de Go est contraint à un environnement fixe et strict : il n’y a pas de hasard ou de chance qui affecte le résultat. D’appliquer cette approche à des scénarios réels où il y a un niveau d’imprévisibilité, est beaucoup plus difficile.

La nouvelle recherche de DeepMind a été publiée dans la revue Nature : Mastering the game of Go without human knowledge et constitue un autre pas important vers l’objectif de l’entreprise de créer une intelligence artificielle globale.

Faire un Don !

Pourquoi ?

Parce qu’il n'y a aucune publicité ici et que le Guru compte sur la générosité de ses lecteurs(trices) pour continuer à faire vivre GuruMeditation (...et son créateur par la même occasion). D'autres méthodes vous seront proposées en plus de PayPal.

Nos nuits gagnent 2 % de luminosité chaque année… et c’est un problème

L’immense popularité des composants électriques brillants et économes en énergie, appelés diodes électroluminescentes ou LED pour light-emitting diode, fut un atout pour l’environnement. Mais les chercheurs découvrent qu’elle a également un coût plutôt sérieux.

Le problème croissant de la pollution lumineuse ne montre aucun signe de ralentissement, ce qui est une mauvaise nouvelle pour nos écosystèmes et notre santé.

Finalement ces stries sombres qui descendent les pentes martiennes ne serait pas formées par de l’eau

Mars est un endroit assez aride, et bien que de vastes océans aient probablement déjà recouvert sa surface, de nos jours toute l’eau restante semble être enfermée dans la glace aux pôles ou sous terre. Mais en 2011, la sonde Mars Reconnaissance Orbiter (MRO) a repéré des stries sombres qui apparaissent en été et disparaissent en hiver dans la poussière martienne, faisant allusion à l’influence d’eau qui coule. En y regardant de plus près, un nouveau rapport…

Sur la mouche qui peut rester sèche dans l’eau la plus humide du monde

Le lac Mono, dans le désert de la Sierra Nevada en Californie, n’est pas un lac d’eau douce comme les autres. Non seulement il est trois fois plus salé que l’océan, mais il est également plein de carbonate de sodium et de borax, qui est essentiellement un détergent à lessive. Le pH élevé de l’eau lui confère une texture glissante et presque grasse.

Aucun poisson ou autre vertébré ne survit dans ce lac…

Sur la véritable identité de l’objet interstellaire qui a traversé notre système solaire

Il y a peu, un objet en provenance de l’espace interstellaire est apparu dans notre système solaire. L’Observatoire européen austral (ESO) a confirmé que l’objet, provisoirement dénommé A / 2017 U1, est en fait un astéroïde provenant de l’extérieur du système solaire. Le premier voyageur interstellaire détecté, maintenant appelé « Oumuamua », se révèle être différent de tous les objets repérés auparavant et il a erré…

80 changements de saison dans cette vidéo d’une planète Terre haletante

Cette nouvelle vidéo de la Terre montre comment notre planète a changé au cours des deux dernières décennies alors que les satellites de la NASA surveillaient continuellement les populations de plantes sur terre et dans les océans.

Elle montre la Terre “respirer” au fur et à mesure que les saisons changent, avec une couverture de neige sur les pôles Nord et Sud augmentant et diminuant périodiquement tandis que des zones vertes de végétation font de même…

3 700 mondes au-delà du système solaire classés dans un tableau périodique des exoplanètes

Chaque année, nous découvrons de nouvelles exoplanètes, des planètes à l’extérieure de notre système solaire et une équipe d’astronomes a trouvé une ingénieuse manière de cartographier les 3 736 exoplanètes que nous connaissons jusqu’à présent.

Il est appelé le tableau périodique des exoplanètes et il classe ces milliers de planètes en fonction de leur taille, composition et de…

Découverte d’une planète de la taille de la Terre accompagnée d’une paisible étoile à 2 pas cosmiques de chez nous

À seulement 11 années-lumière de notre système solaire, une exoplanète qui vient d’être découverte est la deuxième plus proche de la Terre et elle serait suffisamment tempérée pour potentiellement accueillir et maintenir la vie.

Les astronomes ont repéré ce monde de la masse de la Terre entourant la petite et pâle étoile Ross 128, qui se trouve à 11 années-lumière du soleil. La planète, connue sous le nom de Ross 128b, pourrait profiter de températures de surface favorables à la vie telle…

Une image de Saturne dans un dernier adieu à la sonde Cassini

Le 15 septembre, la sonde spatiale Cassini de la NASA a terminé sa mission à proximité de la renommée Saturne avec une plongée kamikaze dans l’atmosphère de la géante gazeuse. La NASA a maintenant publié une mosaïque de Saturne et ses anneaux créés à partir d’images prises par l’explorateur dans les derniers jours de sa 293e dernière orbite fatale.

La mosaïque est composée de 42 images individuelles prises par la caméra grand-angle de Cassini en utilisant des filtres spectraux…

Peut-on recloner un clone ? (oui!)

Une équipe de chercheurs de l’université nationale de Séoul, de l’université de l’Etat du Michigan et de l’université de l’Illinois à Urbana-Champaign a « recloné » le premier chien cloné. Dans leur étude, le groupe décrit la duplication du clone et offre une mise à jour sur la façon dont les chiens font.

En 2005, des chercheurs de l’université nationale de Séoul ont rapporté qu’ils avaient cloné un chien afghan, le premier chien à être…

Deux cartes pour comparer le temps que l’on mettait à atteindre sa destination dans le monde en 1914 et en 2016

La carte isochrone, en entête et sur laquelle vous allez cliquer pour l’agrandir, présente le temps qu’un voyageur mettait pour atteindre sa destination en partant de Londres avec les moyens de locomotion disponible en 1914.

Elle a été créée cette même année par le cartographe royal anglais John G. Bartholomew et incluse avec plusieurs autres outils de ce type dans son Atlas de géographie économique…

La première représentation par l’humain de chiens en laisse

Une équipe de chercheurs de l’institut Max-Planck (Allemagne) et de la Commission saoudienne du tourisme et du patrimoine national a documenté ce qui pourrait être la plus ancienne représentation de chiens par des êtres humains…

Des dauphins mâles vont cueillir des éponges pour tenter de séduire les femelles

Des chercheurs de l’université d’Australie-Occidentale ont capturé quelques images d’un rare étalage à visée sexuel : des dauphins mâles à bosse (Sousa) présentant de grandes éponges marines à des femelles dans une apparente tentative d’accouplement.

Ils ont documenté des dauphins à bosse mâles adultes australiens présentant de grandes éponges marines aux femelles, ainsi que des manifestations/ représentations visuelles et acoustiques…

Le robot Atlas s’entraine apparemment pour les Jeux Olympiques

Un robot qui marche, même si c’est devenu courant, ça reste impressionnant… mais qu’en est-il de celui qui peut faire des sauts périlleux arrière ? Cela deviendrait presque inquiétant… Cette semaine, la société américaine spécialisée en robotique Boston Dynamics a publié une vidéo de son dernier robot humanoïde Atlas qui peut non seulement sauter et tourner sur lui-même, mais aussi faire un saut périlleux arrière complet avant d’atterrir comme un gymnaste…

Comment visualiser les processus en œuvre dans une année d’ouragans ? (Vidéo)

Une simulation, réalisée à partir de données satellitaires de l’intense saison 2017 des ouragans de l’Atlantique, montre comment les météorologues du Goddard Space Center de la NASA emploient de minuscules aérosols tels que le sel de mer évaporé, la poussière du désert saharien et la fumée de feu pour visualiser comment une tempête se déplace sur l’océan et d’estimer sa future trajectoire…

Pin It on Pinterest

Share This