Sélectionner une page

L’intelligence artificielle de Google n’a même plus besoin des humains pour les surpasser au jeu de go

19 Oct 2017 | 1 commentaire

Go-deepmind

L‘intelligence artificielle (IA) AlphaGo de Google DeepMind, qui avait déjà battu l’humain au jeu de go, est devenue encore plus intelligente. Le dernier système de l’entreprise a non seulement battu toutes les précédentes versions du logiciel, mais il l’a fait tout seul.

Selon Demis Hassabis, PDG et cofondateur de DeepMind :

La chose la plus frappante pour moi est que nous n’avons plus besoin de données humaines.

Alors que la première version d’AlphaGo devait être formée à partir des données de plus de 100 000 parties humaines, l’AlphaGo Zero peut apprendre à jouer à partir d’une « feuille blanche ». DeepMind a non seulement éliminé le besoin initial d’une entrée de données humaines, mais Zero est également capable d’apprendre plus vite que son prédécesseur.

David Silver, le principal programmeur du projet Go de DeepMind, affirme que l’AlphaGo qui avait battu le champion du monde (18 fois) Lee Sedol 4-1 a demandé plusieurs mois d’entraînement.

Nous avons atteint un niveau de performance supérieur après seulement 72 heures d’entraînement avec l’AlphaGo Zero.

Seulement 4,9 millions de jeux simulés ont été nécessaires pour former Zero, par rapport aux 30 millions d’origine de l’AlphaGo. Après trois jours d’apprentissage, Zero a réussi à vaincre la version de Lee Sedol, 100-0. Après avoir joué pendant 40 jours, Zero a battu la version la plus puissante d’AlphaGo de DeepMind, appelée Master, qui a battu le maître chinois Ke Jie en mai.

Pour Satinder Singh, directeur du laboratoire IA de l’université du Michigan :

Zero surpasse massivement l’AlphaGo déjà surhumain et pourrait être l’une des plus grandes avancées de l’IA jusqu’à maintenant.

Quand AlphaGo Zero a commencé à jouer contre lui-même, il ne lui a été présenté qu’un ensemble de règles, un plateau et les pions blancs et noirs. Il ne savait pas quelles stratégies, mouvements ou tactiques seraient nécessaires pour gagner. « Les seules ressources nécessaires sont les pierres noires et blanches du plateau », selon Silver, ajoutant qu’il croit que l’entreprise pourrait créer un système capable d’apprendre les règles du jeu.

Un goban traditionnel, plateau du jeu de go, avec des pierres noires et blanches. (Wikipédia)

Go_game

Dès le début, à partir du moment où Zero a reçu les règles, le système a joué des parties contre lui-même. Pendant ce temps, il apprend les mouvements qu’il peut faire et qui le conduiront à une victoire. Pour que DeepMind améliore son système déjà couronné de succès et parvienne à ce résultat, il a dû refaire les algorithmes utilisés dans l’IA.

Le processus global utilise un algorithme d’apprentissage par renforcement combiné avec un système de recherche. Pour faire simple, cela signifie que Zero apprend par des essais et des erreurs et peut utiliser son système de recherche pour évaluer chaque mouvement potentiel.

Lorsque Zero a joué un match contre lui-même, il a reçu des rétroactions du système. Un +1 est donné s’il gagne et un -1 s’il perd. Après chaque partie, le réseau neuronal du Zero se reconfigure automatiquement en une nouvelle version, théoriquement meilleure. En moyenne, le système prenait 0,4 seconde de réflexion avant de réaliser un mouvement.

Le nouveau système utilise un seul réseau neuronal au lieu des deux et quatre des processeurs AI de Google, par rapport aux 48 nécessaires pour battre Lee. Au cours du développement de Zero, Hassabis affirme que le système a été formé sur du matériel qui a coûté près de 35 millions de dollars (29 millions d’Euros) à l’entreprise. Le matériel est également utilisé pour d’autres projets DeepMind.

Dans le développement de Zero, DeepMind a été capable de faire plus… avec moins. Dans ses tests en internes, la firme affirme que Zero a pu battre toutes ses précédentes versions : AlphaGo Master, AlphaGo Lee, AlphaGo Fan, Crazy Stone, Pachi et GruGo. Silver ajoute que Zero n’a pas atteint son niveau maximal possible de connaissance, mais uniquement parce que l’équipe a cessé de travailler sur le projet.

L’étude conclut :

Il est possible de l’entraîner à un niveau surhumain, sans exemples ni conseils humains, sans connaissance du domaine au-delà des règles de base.

Le système a appris les mouvements et les tactiques humaines communes et les a complétés avec ses propres et ses plus efficaces mouvements.

Comme pour la victoire de Deep Blue contre le grand maître des échecs Gary Kasparaov en 1996, le succès continu de DeepMind au jeu de Go a des implications plus larges.

Mais aussi avancé soit Zero, il ne peut être appliqué à n’importe quel problème et le résoudre.

Selon M. Singh :

Pris ensemble, les résultats suggèrent que les IA fondées sur l’apprentissage par renforcement peuvent être bien meilleures que celles qui reposent sur l’expertise humaine. Le système, par exemple, ne pouvait pas être utilisé pour traduire des langues.

Pour Hassabis et ses collègues, le défi permanent consiste à appliquer ce qui a été appris dans le cadre du projet AlphaGo à d’autres problèmes d’intelligence artificielle avec des applications dans le monde réel.

Nous avons essayé de concevoir l’algorithme pour qu’il puisse jouer, en principe, à d’autres jeux appartenant à une classe similaire (incluant les échecs) et plus généralement aux domaines de la planification.

Cela inclut le repliement des protéines, la découverte de médicaments, la conception de matériaux et la chimie quantique. Une partie de la résolution de ces problèmes réside dans la capacité à créer des simulations de résultats potentiels. Le jeu de Go est contraint à un environnement fixe et strict : il n’y a pas de hasard ou de chance qui affecte le résultat. D’appliquer cette approche à des scénarios réels où il y a un niveau d’imprévisibilité, est beaucoup plus difficile.

La nouvelle recherche de DeepMind a été publiée dans la revue Nature : Mastering the game of Go without human knowledge et constitue un autre pas important vers l’objectif de l’entreprise de créer une intelligence artificielle globale.

Faire un Don !

Pourquoi ?

Parce qu’il n'y a aucune publicité ici et que le Guru compte sur la générosité de ses lecteurs(trices) pour continuer à faire vivre GuruMeditation (...et son créateur par la même occasion). D'autres méthodes vous seront proposées en plus de PayPal.

Nous nous sommes trompés sur la taille d’Andromède, la galaxie qui fusionnera avec la nôtre

Une nouvelle technique pour mesurer la masse des galaxies a été appliquée à notre plus proche voisine galactique et elle a trouvé que la galaxie d’Andromède a à peu près la même taille que la Voie lactée et pas deux à trois fois plus comme on le pensait auparavant.

Cela signifie que lorsque les deux galaxies fusionneront dans environ 4 milliards d’années, la Voie lactée ne sera pas entièrement consommée par la galaxie d’Andromède comme l’avaient suggéré de précédents modèles…

Les rayons X révèlent des secrets cachés dans les œuvres de Pablo Picasso

Grâce, notamment, au pouvoir pénétrant des rayons X des scientifiques ont révélé certains secrets cachés dans les peintures et les sculptures de Pablo Picasso.

Une nouvelle recherche révèle ainsi que Picasso a peint sur une autre œuvre d’un artiste inconnu de Barcelone pour créer une de ses œuvres les plus célèbres de sa « période bleue »…

Découvertes de 100 nouveaux mondes extraterrestres par la mission Kepler

Des astronomes examinant les données recueillies au cours de la mission actuelle du télescope spatial Kepler, connue sous le nom de mission K2, ont repéré 95 nouvelles planètes extraterrestres (exoplanètes), selon une nouvelle étude.

Cela porte le nombre de ces mondes découverts lors de la mission K2 à 292, et le total passe à près de 2 440 sur toute la vie opérationnelle de Kepler, ce qui représente environ les deux tiers de toutes les exoplanètes découvertes jusqu’ici…

Un potentiel vaccin utilise des cellules souches pour former le système immunitaire à reconnaître les cancers

Dans le domaine de l’immunothérapie, une nouvelle étude menée par des chercheurs de l’université de Stanford a montré que les souris à qui l’on a injecté des cellules souches pluripotentes induites (CSPi) inactivées présentent des réponses importantes du système immunitaire face à divers cancers. Si l’étude peut être reproduite chez l’homme, cette recherche pourrait ouvrir la voie à un traitement anticancéreux personnalisé révolutionnaire…

Ces fourmis soignent et sauvent au cas par cas leurs camarades blessées sur le champ de bataille

Dans une récente étude, des scientifiques ont observé des fourmis soignant leurs camarades blessés, sauvant celles qui peuvent encore l’être et délaissant les plus atteintes, ce qui pourrait être le premier exemple scientifiquement documenté (mis à part l’humain) de tels soins médicaux dans le règne animal.

La fourmi africaine Megaponera analis se spécialise dans la chasse aux termites…

Premier prix pour l’image de la capture d’un seul atome

Le premier prix d’un concours annuel de photographie scientifique organisé par l’Engineering and Physical Sciences Research Council (EPSRC) au Royaume-Uni a été remporté par l’image remarquable d’un seul atome de strontium suspendu dans un champ électrique (en entête).

Réalisée par David Nadlinger, de l’université d’Oxford, elle montre l’atome retenu par les champs émanant des électrodes métalliques…

Il y a 8000 ans, en Suède, des crânes humains ont été empalés sur des pieux et personne ne sait pourquoi

Des archéologues en Suède ont trouvé des restes humains curieusement disposés avec la présence de têtes décapitées montées sur des pieux, un comportement qui n’a jamais été suggéré auparavant pour les anciens chasseurs-cueilleurs européens. Cette sinistre découverte remet en question ce que nous savons de la culture européenne du mésolithique et comment ces premiers humains s’occupaient de leurs morts…

La Terre et la Lune photographiées à une distance de 63 millions de kilomètres

Voici une nouvelle perspective sur votre planète, fournie par une sonde d’échantillonnage d’astéroïdes de la NASA.

La Terre et la Lune ne sont que deux points lumineux flottant dans un immense vide noir, capturée par la sonde spatiale OSIRIS-REx le 17 janvier, à une distance de 63,6 millions de kilomètres…

La voiture Tesla envoyée dans l’espace a-t-elle des chances de nous revenir dessus ?

Pour le rappel, la société SpaceX appartenant à Elon Musk a envoyé une voiture électrique Tesla dans l’espace la semaine dernière.

Elle devrait emprunter une trajectoire autour du Soleil qui l’amènera de temps en temps à proximité de Mars. Mais même si ça peut durer des millions d’années, ça ne durera pas éternellement…

Il a écrit une fausse étude basée sur le pire épisode de Star Trek et elle a été publiée dans une revue scientifique

Un biologiste anonyme cherchant à montrer à quel point il est facile de publier une fausse étude dans certaines revues scientifiques prétendument revues par les pairs (peer-reviewed), a récemment soumis un document de recherche intitulé « Rapid Genetic and Developmental Morphological Change Following Extreme Celerity » (Rapide changement génétique et morphologique du développement suite à une célérité extrême)…

Le minage de cryptomonnaies entrave la recherche d’extraterrestre

Le minage de cryptomonnaies ne se contente pas d’engloutir les capacités des réseaux électriques du monde entier, elle pourrait également ralentir la recherche de la vie extraterrestre.

Ces monnaies virtuelles comme Bitcoin exigent que les mineurs résolvent des calculs complexes pour valider chaque transaction. Pour leurs efforts, les mineurs reçoivent un petit paiement, mais le processus nécessite une grande puissance de calcul…

Le robot SpotMini ouvre la porte à une ancienne version de lui-même

La société américaine Boston Dynamics est de retour avec une nouvelle vidéo présentant une de ses créations, la dernière itération du robot SpotMini.

Ce dernier a considérablement changé depuis ses débuts publics, ses mouvements sont plus animés, plus souples et il dispose d’un corps plus élancé, plus mince. Ce n’est plus simplement un robot-chien, il profite désormais d’un bras rotatif flexible muni d’une pince…

Starman écoute du David Bowie en conduisant son roadster Tesla dans l’espace

Le Guru a mis à jour son billet sur le lancement du plus puissant lanceur, la Falcon Heavy et de sa curieuse cargaison, que vous pouvez admirer dans cette image, façon SPaceX. Tout s’est passé comme prévu… à une petite exception près…

SpaceX + Tesla : aujourd’hui, une voiture électrique à bord de la plus puissante fusée humaine pourrait tenter d’atteindre Mars (Vidéos)

Et ce n’est pas une plaisanterie ! Votre Guru est pris un peu aux dépourvues…

Elon Musk, le PDG, entre autres, de SpaceX, à décider d’envoyer aujourd’hui même une voiture Tesla vers Mars à bord de la fusée opérationnelle la plus puissante du monde.

Musk à lui-même reconnu que c’était un gros «si (tout se passe bien)» et une vidéo partagée par l’entreprise montre comment ce voyage se déroulera si tout se passe comme prévu…

Pin It on Pinterest

Share This