Des humanoïdes dirigés par une intelligence artificielle ont appris à jouer au football
DeepMind, la division de Google spécialisée dans l’intelligence artificielle (IA), a appris à des humanoïdes d’IA à travailler en équipe pour jouer au football, les faisant passer du statut de bambins agités à celui de joueurs compétents. Les chercheurs ont fait passer une simulation informatique par un programme de formation sportive, en donnant à l’IA le contrôle d’humanoïdes ayant des masses corporelles et des mouvements réalistes.
Image d’entête : l’intelligence artificielle, via ces humanoïdes, apprend à jouer au football de manière compétitive. (DeepMind)
Ce n’est pas la première fois que DeepMind s’essaie aux jeux. L’IA a déjà maîtrisé les échecs et le go, un exploit que les chercheurs pensaient presque impossible auparavant. Ensuite, le groupe s’est concentré sur d’autres jeux, comme Mario, Starcraft, Quake3… Aujourd’hui, le système semble prêt à s’attaquer à un « vrai » jeu.
Les chercheurs de Google ont entraîné une IA physiquement simulée à jouer à des jeux à deux contre deux dans le cadre d’une expérience visant à faire progresser la coordination entre les systèmes d’IA et à offrir de nouvelles voies vers la création d’une Intelligence artificielle forte (AGI pour Artificial general intelligence) d’un niveau similaire à celui de l’humain. Ils décrivent comment ils ont réussi dans une étude publiée cette semaine (lien plus bas).
Selon les chercheurs de DeepMind :
Nos agents ont acquis des compétences, notamment une locomotion agile, des passes et une répartition des tâches, comme le démontrent une série de statistiques. Les joueurs présentent à la fois un contrôle moteur agile à haute fréquence et une prise de décision sur le long terme qui impliquait l’anticipation des comportements de leurs coéquipiers, ce qui a conduit à un jeu d’équipe coordonné.
Ce n’est pas la première fois que l’IA maîtrise un jeu juste en le regardant. Un exploit similaire a été accompli avec des jeux informatiques simples, mais regarder un jeu informatique en train de se dérouler et regarder un « vrai » jeu joué par des humains sont deux choses différentes.
Les chercheurs ont d’abord montré des vidéos de capture de mouvement d’humains jouant au football, entraînant les humanoïdes à courir naturellement en imitant les vidéos. Ils se sont ensuite exercés à dribbler et à tirer le ballon grâce à l’apprentissage automatique qui récompensait l’IA lorsqu’elle restait près du ballon. Ces deux phases ont représenté environ un an et demi d’entraînement par simulation, que l’IA a parcouru en 24 heures.
Les agents/ humanoïdes imitent d’abord le mouvement des joueurs de football pour apprendre suivre la balle, dribbler et tirer. (DeepMind)
Cependant, des comportements plus complexes que le mouvement et le contrôle du ballon ont commencé à émerger après d’autres simulations. Les chercheurs ont mis les humanoïdes au défi de marquer des buts dans des matchs à deux contre deux. Ils acquièrent des compétences en matière de travail d’équipe, telles que l’anticipation de l’endroit où recevoir une passe, en 20 à 30 ans de simulation, soit l’équivalent de deux à trois semaines dans le monde réel.
Selon les chercheurs dans leur étude :
Nous avons optimisé des équipes d’agents pour jouer au football simulé via l’apprentissage par renforcement, en contraignant les solutions à celles de mouvements plausibles appris à l’aide de données de capture de mouvements humains. Le résultat est une équipe de joueurs de football humanoïdes coordonnés qui présentent un comportement complexe à différentes échelles, quantifié par une gamme d’analyses et de statistiques.
Les humanoïdes ont été entraînés sur des règles simples qui autorisaient les fautes, fournissaient une limite semblable à un mur autour du terrain et évitaient des éléments tels que les tirs au but et les remises en jeu. Ces règles et le long temps d’apprentissage signifient que la simulation ne débouchera pas immédiatement sur des robots jouant au football. Les chercheurs apprennent maintenant aux robots à pousser un ballon vers une cible.
Depuis des années, les ingénieurs tentent de créer des robots capables de jouer au football. Cela a donné lieu à une compétition entre groupes pour savoir qui pouvait créer les meilleurs robots joueurs. Et cela a conduit à la création de la RoboCup, avec plusieurs ligues dans le monde réel et simulé. Aujourd’hui, les chercheurs ont franchi une nouvelle étape en apprenant aux robots à jouer au football sans leur enseigner les règles.
Si les regarder jouer au football est plutôt amusant, ce n’est pas vraiment l’objectif final de l’expérience. Elle s’inscrit dans le cadre des recherches menées sur “cognition incarnée« . Il s’agit de l’idée qu’une Intelligence artificielle forte pourrait un jour être nécessaire pour se déplacer dans le monde sous une forme physique quelconque, et que la nature de cette forme pourrait déterminer la façon dont elle se comporte.
Considérez cela de la manière suivante : si vous pouvez apprendre à un système d’IA à effectuer (virtuellement) les tâches que font les humains, cela pourrait être utilisé pour créer des systèmes réels qui font la même chose. En fait, nous pourrions apprendre à des robots à faire les mêmes choses que les humains et le potentiel est énorme.
Les compétences de locomotion peuvent ensuite être réutilisées pour la marche contrôlable et le dribble de balle sur de vrais robots. (DeepMind)
Selon l’étude :
Les résultats présentés dans cette étude ne constituent qu’un petit pas vers une intelligence motrice de niveau humain dans les systèmes artificiels. Bien que le scénario présenté dans la présente étude soit plus difficile que de nombreux environnements simulés envisagés dans la communauté, il manquait de complexité selon des dimensions importantes par rapport aux scénarios du monde réel.
L’étude publiée dans Science Robotics : From motor control to team play in simulated humanoid football et présentée sur le blog de Deep Mind : From motor control to embodied intelligence.
Pas trop étonnant si on estime le QI des humains les mieux payés au monde à 60…
🙂