Une intelligence artificielle donne vie à la Joconde et à d’autres portraits
Utilisant la dernière tendance dans le domaine de l’intelligence artificielle (IA), appelée apprentissage machine antagoniste (Adversarial machine learning), le Centre d’IA de Samsung à Moscou a démontré qu’il peut utiliser une seule image d’une personne et la mettre en mouvement.
Le système utilise un certain nombre d’images d’une personne, de une à plusieurs afin d’obtenir de meilleurs résultats, et les faits passer dans un » traceur/ suiveur de repère du visage » prêt à l’emploi pour déterminer où se trouvent les yeux, les sourcils, le nez, les lèvres et la mâchoire. Il en va de même pour une autre vidéo source « pilote », en image par image pour suivre le mouvement de ces repères faciaux.
Il y a une étape distincte d’apprentissage, au cours de laquelle différents réseaux d’IA sont formés pour effectuer différentes tâches, en utilisant un énorme ensemble de données vidéo de têtes parlantes. Un réseau “Embedder” prend les trames sources et leurs données de suivi des points de repère pour créer des vecteurs, tandis qu’un réseau “Generator” (génératif) apprend à récupérer les vecteurs et les images pour générer de courtes vidéos dans lesquelles les visages fixes sont animés pour bouger selon le mouvement du vecteur.
Le troisième réseau « Discriminator » met en place la relation “contradictoire/ concurrentielle”, il apprend à regarder des vidéos de visages en mouvement, et à faire la différence entre les vraies vidéos, de celles qui ont été truquées par le réseau Generator. Il y a donc deux réseaux qui s’opposent l’un à l’autre, l’un essayant de tromper l’autre, l’autre de repérer les faux.
Ces réseaux débutent assez mal leur travail, mais comme ils l’exécutent des millions de fois, ils s’améliorent au fil du temps, et la concurrence entre les deux réseaux est ce qui les pousse à s’améliorer. Le réseau Discriminator ne cherche pas les mêmes choses qu’un faux observateur humain, mais cela n’a pas d’importance, quoiqu’il cherche, il s’améliore sans cesse dans la discrimination, donc le réseau Generator doit continuer à s’améliorer pour continuer à le tromper.
C’est un autre aperçu du potentiel très intéressant des réseaux antagonistes génératifs, qui font leur apparition dans le monde des IA. Mais pour vraiment l’apprécier, il faudra regarder la vidéo ci-dessous.
Passez directement à 4mn 16 secs si vous voulez voir comment le modèle se comporte avec les photos de Marilyn Monroe, Salvador Dali, Raspoutine et Einstein, puis avec des peintures.
De voir la Joconde prendre vie pourrait faire sourire, jusqu’à prendre conscience que de tels développements signifient plus de réalisme et de facilité à produire des Deepfakes (permutation intelligente de visages).
L’étude en prépublication sur arXiv (PDF) : Few-Shot Adversarial Learning of Realistic Neural Talking Head Models.
[totaldonations_circle_bar id="81539"]
Il n'y a pas de publicité ici et le Guru tente, cette semaine, de réunir les fonds nécessaires pour continuer à faire vivre GuruMeditation. On y est presque et votre aide est absolument nécessaire et cela se passe ici.
Pas Raspoutine: Dostoievski