L’intelligence artificielle de Google n’a même plus besoin des humains pour les surpasser au jeu de go

19 Oct 2017 | 1 commentaire

L‘intelligence artificielle (IA) AlphaGo de Google DeepMind, qui avait déjà battu l’humain au jeu de go, est devenue encore plus intelligente. Le dernier système de l’entreprise a non seulement battu toutes les précédentes versions du logiciel, mais il l’a fait tout seul.

Selon Demis Hassabis, PDG et cofondateur de DeepMind :

La chose la plus frappante pour moi est que nous n’avons plus besoin de données humaines.

Alors que la première version d’AlphaGo devait être formée à partir des données de plus de 100 000 parties humaines, l’AlphaGo Zero peut apprendre à jouer à partir d’une « feuille blanche ». DeepMind a non seulement éliminé le besoin initial d’une entrée de données humaines, mais Zero est également capable d’apprendre plus vite que son prédécesseur.

David Silver, le principal programmeur du projet Go de DeepMind, affirme que l’AlphaGo qui avait battu le champion du monde (18 fois) Lee Sedol 4-1 a demandé plusieurs mois d’entraînement.

Nous avons atteint un niveau de performance supérieur après seulement 72 heures d’entraînement avec l’AlphaGo Zero.

Seulement 4,9 millions de jeux simulés ont été nécessaires pour former Zero, par rapport aux 30 millions d’origine de l’AlphaGo. Après trois jours d’apprentissage, Zero a réussi à vaincre la version de Lee Sedol, 100-0. Après avoir joué pendant 40 jours, Zero a battu la version la plus puissante d’AlphaGo de DeepMind, appelée Master, qui a battu le maître chinois Ke Jie en mai.

Pour Satinder Singh, directeur du laboratoire IA de l’université du Michigan :

Zero surpasse massivement l’AlphaGo déjà surhumain et pourrait être l’une des plus grandes avancées de l’IA jusqu’à maintenant.

Quand AlphaGo Zero a commencé à jouer contre lui-même, il ne lui a été présenté qu’un ensemble de règles, un plateau et les pions blancs et noirs. Il ne savait pas quelles stratégies, mouvements ou tactiques seraient nécessaires pour gagner. « Les seules ressources nécessaires sont les pierres noires et blanches du plateau », selon Silver, ajoutant qu’il croit que l’entreprise pourrait créer un système capable d’apprendre les règles du jeu.

Un goban traditionnel, plateau du jeu de go, avec des pierres noires et blanches. (Wikipédia)

Dès le début, à partir du moment où Zero a reçu les règles, le système a joué des parties contre lui-même. Pendant ce temps, il apprend les mouvements qu’il peut faire et qui le conduiront à une victoire. Pour que DeepMind améliore son système déjà couronné de succès et parvienne à ce résultat, il a dû refaire les algorithmes utilisés dans l’IA.

Le processus global utilise un algorithme d’apprentissage par renforcement combiné avec un système de recherche. Pour faire simple, cela signifie que Zero apprend par des essais et des erreurs et peut utiliser son système de recherche pour évaluer chaque mouvement potentiel.

Lorsque Zero a joué un match contre lui-même, il a reçu des rétroactions du système. Un +1 est donné s’il gagne et un -1 s’il perd. Après chaque partie, le réseau neuronal du Zero se reconfigure automatiquement en une nouvelle version, théoriquement meilleure. En moyenne, le système prenait 0,4 seconde de réflexion avant de réaliser un mouvement.

Le nouveau système utilise un seul réseau neuronal au lieu des deux et quatre des processeurs AI de Google, par rapport aux 48 nécessaires pour battre Lee. Au cours du développement de Zero, Hassabis affirme que le système a été formé sur du matériel qui a coûté près de 35 millions de dollars (29 millions d’Euros) à l’entreprise. Le matériel est également utilisé pour d’autres projets DeepMind.

Dans le développement de Zero, DeepMind a été capable de faire plus… avec moins. Dans ses tests en internes, la firme affirme que Zero a pu battre toutes ses précédentes versions : AlphaGo Master, AlphaGo Lee, AlphaGo Fan, Crazy Stone, Pachi et GruGo. Silver ajoute que Zero n’a pas atteint son niveau maximal possible de connaissance, mais uniquement parce que l’équipe a cessé de travailler sur le projet.

L’étude conclut :

Il est possible de l’entraîner à un niveau surhumain, sans exemples ni conseils humains, sans connaissance du domaine au-delà des règles de base.

Le système a appris les mouvements et les tactiques humaines communes et les a complétés avec ses propres et ses plus efficaces mouvements.

Comme pour la victoire de Deep Blue contre le grand maître des échecs Gary Kasparaov en 1996, le succès continu de DeepMind au jeu de Go a des implications plus larges.

Mais aussi avancé soit Zero, il ne peut être appliqué à n’importe quel problème et le résoudre.

Selon M. Singh :

Pris ensemble, les résultats suggèrent que les IA fondées sur l’apprentissage par renforcement peuvent être bien meilleures que celles qui reposent sur l’expertise humaine. Le système, par exemple, ne pouvait pas être utilisé pour traduire des langues.

Pour Hassabis et ses collègues, le défi permanent consiste à appliquer ce qui a été appris dans le cadre du projet AlphaGo à d’autres problèmes d’intelligence artificielle avec des applications dans le monde réel.

Nous avons essayé de concevoir l’algorithme pour qu’il puisse jouer, en principe, à d’autres jeux appartenant à une classe similaire (incluant les échecs) et plus généralement aux domaines de la planification.

Cela inclut le repliement des protéines, la découverte de médicaments, la conception de matériaux et la chimie quantique. Une partie de la résolution de ces problèmes réside dans la capacité à créer des simulations de résultats potentiels. Le jeu de Go est contraint à un environnement fixe et strict : il n’y a pas de hasard ou de chance qui affecte le résultat. D’appliquer cette approche à des scénarios réels où il y a un niveau d’imprévisibilité, est beaucoup plus difficile.

La nouvelle recherche de DeepMind a été publiée dans la revue Nature : Mastering the game of Go without human knowledge et constitue un autre pas important vers l’objectif de l’entreprise de créer une intelligence artificielle globale.

Faire un Don !



Pourquoi ?

Parce qu’il n'y a aucune publicité ici et que le Guru compte sur la générosité de ses lecteurs(trices) pour continuer à faire vivre GuruMeditation (...et son créateur par la même occasion). D'autres méthodes vous seront proposées en plus de PayPal.

← Article Précédent Article Suivant →

Derniers Articles

Des astronomes découvrent le plus grand trou noir stellaire de notre galaxie et il est proche de la Terre

Le plus grand trou noir stellaire de la Voie lactée a été découvert par la mission Gaia de l’Agence spatiale européenne. Et il est très proche de la Terre.

Baptisé Gaia BH3, il pèse 33 fois la masse de notre soleil, soit plus de 50 % de plus que le deuxième plus grand trou noir stellaire, Cygnus X-1, qui pèse 21 masses solaires. Il existe des trous noirs plus grands dans notre galaxie, mais aucun d’entre eux n’a été formé par l’effondrement du cœur d’une étoile massive.

Par exemple, Sagittarius A*, le trou noir…

Lire

Pain perdu : Découverte d’un pain vieux de 8 600 ans en Turquie

Des archéologues de l’université Necmettin Erbakan ont découvert en Anatolie centrale, en Turquie, ce que l’on pense être le plus vieux pain du monde. Sécouvert sur le site néolithique de Çatalhöyük, l’un des sites les plus grands et les mieux préservés de ce type, est estimé à environ 8 600 ans, soit 6600 ans avant notre ère. Cette découverte rare et inattendue montre à quel point les pratiques culinaires des premières sociétés agraires étaient avancées.

Çatalhöyük est situé au sud-est de l’actuelle Konya, non loin du mont Hasan…

Lire

Sur l’origine du cœur de Pluton

Le « cœur » de Pluton, également connu sous le nom de Tombaugh Regio, a attiré l’attention du public dès sa découverte. Mais il a également suscité l’intérêt des scientifiques parce qu’il est recouvert d’un matériau à albédo élevé qui réfléchit plus de lumière que son environnement, d’où sa couleur plus blanche.

Maintenant, des chercheurs affirment avoir trouvé le scénario le plus probable à l’apparition de ce coeur, à savoir une ancienne collision avec un corps planétaire d’un peu plus de 640 km de large…

Lire

Goldene: la première feuille d’or d’un seul atome d’épaisseur

Pour la première fois, des scientifiques de l’université de Linköping, en Suède, ont réussi à mettre au point des feuilles d’or de l’épaisseur d’un seul atome. Baptisé « goldene », ce matériau révolutionnaire présente de nouvelles propriétés qui pourraient transformer plusieurs applications technologiques, de la catalyse à l’électronique de pointe.

Il n’y a pas si longtemps, le graphène faisait constamment la une des journaux, car il était incroyablement solide, fin, flexible, léger et un excellent conducteur de…

Lire

La surprenante raison pour laquelle nous clignons des yeux bien plus souvent qu’il est nécessaire

Cligner des yeux permet de les humidifier, mais nous le faisons bien plus souvent qu’il ne le faudrait si c’était la seule raison. Des scientifiques de l’université de Rochester (États-Unis) ont découvert que cette action involontaire joue un rôle plus important que nous le pensions, en nous aidant à traiter les informations visuelles.

On a longtemps pensé que la principale raison pour laquelle nous clignons des yeux était d’éliminer la poussière et les débris de nos yeux, afin de prévenir les infections et…

Lire

Les oiseaux chantent en dormant ce qui permet de déterminer à quoi ils rêvent

Des chercheurs ont suivi les contractions musculaires du conduit vocal d’un oiseau et reconstitué le chant qu’il chantait silencieusement dans son sommeil. Le son obtenu est un appel très spécifique, ce qui a permis à l’équipe de déterminer le sujet du rêve de l’oiseau.

Lorsque les oiseaux dorment, la partie de leur cerveau consacrée au chant diurne reste active et présente des motifs qui ressemblent à ceux produits lorsqu’ils sont éveillés. Des chercheurs de l’université de Buenos Aires (UBA) ont déjà démontré que ces modèles cérébraux…

Lire

Des milliers de météorites encore non découvertes disparaissent dans la glace molle de l’Antarctique

Plus de 60 % de toutes les météorites connues ont été découvertes en Antarctique, car elles sont faciles à repérer et se détachent sur le fond blanc gelé du continent. On estime que jusqu’à 850 000 météorites doivent encore être collectées sur la calotte glaciaire.

Une nouvelle analyse suggère que le réchauffement des températures rend la glace plus molle, ce qui fait que les météorites s’enfoncent profondément hors de notre portée. Au cours des prochaines décennies, nous pourrions ainsi perdre quelque 5 000 météorites par an…

Lire

Dernières Brèves

Photos : Lorsque deux satellites dans des directions opposées se croisent dans l’espace à 10 000 km/h

La sonde Lunar Reconnaissance Orbiter (LRO) de la NASA a pris une photo parfaitement synchronisée lorsqu’elle a croisé le chemin d’un autre engin spatial en orbite autour de la lune.

La sonde LRO, qui est en orbite autour de la lune depuis 15 ans, a pris plusieurs images de l’orbiteur lunaire Danuri de l’Institut de recherche aérospatiale de Corée, alors que les deux engins spatiaux, voyageant sur des orbites presque parallèles, se sont croisés dans des directions opposées au cours de trois orbites entre le 5 et le 6 mars…

Lire

Le professeur physicien Peter Higgs, célèbre pour avoir prédit l’existence du boson de Higgs, meurt à l’âge de 94 ans

Le professeur Peter Higgs, lauréat du prix Nobel, physicien théoricien britannique célèbre pour avoir prédit l’existence d’une nouvelle particule, le boson de Higgs, est décédé lundi 8 avril. L’université d’Édimbourg, où Higgs était professeur émérite, a annoncé mardi qu’il était « décédé paisiblement chez lui … à la suite d’une courte maladie ».

Les bosons de Higgs sont l’excitation quantique du champ de Higgs, un champ qui remplit tout l’univers et qui interagit avec les particules…

Lire

Voyager 1 : Les ingénieurs de la NASA ont repéré la puce défectueuse qui pourrait permettre de réparer l’ordinateur de la plus vieille sonde spatiale

L’une des plus anciennes (47 ans) et des plus lointaines sondes envoyées dans l’espace par l’humain, la sonde Voyager 1 souffre d’une importante défaillance qui l’empêche de transmettre des données scientifiques ou techniques vers la Terre. Les ingénieurs de la NASA ont réduit le problème de la sonde Voyager 1 à une seule puce défectueuse. Il pourrait désormais être possible de contourner la mémoire corrompue et de remettre la sonde interstellaire en état de marche…

Lire

Les astronautes sont conscients de la distance à laquelle ils "volent" dans l’espace en dépit de la microgravité

Des scientifiques étudiant les astronautes à bord de la Station spatiale internationale ont déterminé que les humains sont étonnamment doués pour s’orienter et évaluer la distance qu’ils ont parcourue en microgravité.

Selon Laurence Harris, spécialiste de la vision et de la perception du mouvement à l’université York au Canada, auteur principal de la nouvelle étude…

Lire

Le premier utilisateur de l’implant cérébral Neuralink joue aux échecs par la pensée

La société Neuralink a présenté une vidéo de son premier patient humain, Noland Arbaugh, jouant aux échecs sur ordinateur avec ses pensées grâce à un implant cérébral.

Paralysé des épaules à la suite d’un accident de plongée, Arbaugh s’est montré enthousiaste quant au potentiel de cette technologie… »

Lire

Découverte en Australie de ce qui pourrait être le plus velu des coléoptères

Un entomologiste campant avec son partenaire dans le Queensland, en Australie, a trouvé ce qui pourrait être un concurrent pour le coléoptère le plus touffu d’Australie, et peut-être du monde.

James Tweed, de l’université du Queensland, a fait cette découverte à Noël 2021 au Binna Burra Lodge, une parcelle de terre privée et un…

Lire

Le troisième vol du Starship de SpaceX atteint l’espace, mais disparaît lors de sa rentrée dans l’atmosphère

Après deux explosions spectaculaires en avril et en novembre de l’année dernière, l’énorme “vaisseau spatial” de SpaceX, le Starship a officiellement atteint l’espace pour la deuxième fois…

Lire

Rejoignez les ~~millions~~ quelques abonnées à GuruMeditation et inscrivez-vous aux lettres d'informations (News Letter) !

1 Commentaire

Michel sur 21 octobre 2017 à 9 h 51 min

Il me semble que le principal défit des scénarios réels est de définir les règles. Le système d’apprentissage présenté ici a travaillé avec un nombre fixe de règles fixes et l’évaluation du résultat est simple. Un cas réel (comme le pilotage d’un véhicule autonome pour prendre un sujet à la mode) est bien plus difficile à définir, donc l’apprentissage est plus compliqué. Reste que le résultat est bluffant.
Réponse

Poster le commentaire Annuler la réponse

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

L’intelligence artificielle de Google n’a même plus besoin des humains pour les surpasser au jeu de go

Un goban traditionnel, plateau du jeu de go, avec des pierres noires et blanches. (Wikipédia)

Pourquoi ?

Parce qu’il n'y a aucune publicité ici et que le Guru compte sur la générosité de ses lecteurs(trices) pour continuer à faire vivre GuruMeditation (...et son créateur par la même occasion). D'autres méthodes vous seront proposées en plus de PayPal.

Pourquoi ?

Derniers Articles

Des astronomes découvrent le plus grand trou noir stellaire de notre galaxie et il est proche de la Terre

Pain perdu : Découverte d’un pain vieux de 8 600 ans en Turquie

Sur l’origine du cœur de Pluton

Goldene: la première feuille d’or d’un seul atome d’épaisseur

La surprenante raison pour laquelle nous clignons des yeux bien plus souvent qu’il est nécessaire

Les oiseaux chantent en dormant ce qui permet de déterminer à quoi ils rêvent

Des milliers de météorites encore non découvertes disparaissent dans la glace molle de l’Antarctique

Dernières Brèves

Photos : Lorsque deux satellites dans des directions opposées se croisent dans l’espace à 10 000 km/h

Le professeur physicien Peter Higgs, célèbre pour avoir prédit l’existence du boson de Higgs, meurt à l’âge de 94 ans

Voyager 1 : Les ingénieurs de la NASA ont repéré la puce défectueuse qui pourrait permettre de réparer l’ordinateur de la plus vieille sonde spatiale

Les astronautes sont conscients de la distance à laquelle ils "volent" dans l’espace en dépit de la microgravité

Le premier utilisateur de l’implant cérébral Neuralink joue aux échecs par la pensée

Découverte en Australie de ce qui pourrait être le plus velu des coléoptères

Le troisième vol du Starship de SpaceX atteint l’espace, mais disparaît lors de sa rentrée dans l’atmosphère

NewsLetter

Bravo et Merci !

1 Commentaire

Poster le commentaire Annuler la réponse

Pin It on Pinterest

L’intelligence artificielle de Google n’a même plus besoin des humains pour les surpasser au jeu de go

Un goban traditionnel, plateau du jeu de go, avec des pierres noires et blanches. (Wikipédia)

Pourquoi ? Parce qu’il n'y a aucune publicité ici et que le Guru compte sur la générosité de ses lecteurs(trices) pour continuer à faire vivre GuruMeditation (...et son créateur par la même occasion). D'autres méthodes vous seront proposées en plus de PayPal.

Pourquoi ?

NewsLetter

Bravo et Merci !

1 Commentaire

Poster le commentaire Annuler la réponse

Pin It on Pinterest

Pourquoi ?

Parce qu’il n'y a aucune publicité ici et que le Guru compte sur la générosité de ses lecteurs(trices) pour continuer à faire vivre GuruMeditation (...et son créateur par la même occasion). D'autres méthodes vous seront proposées en plus de PayPal.