Une intelligence artificielle recrée le tableau périodique des éléments en quelques heures et à partir de pas grand-chose
Sous le nom séduisant d’Atom2Vec, un logiciel a appris à distinguer les différents atomes à partir d’une base de données de composés chimiques. Après avoir appris les bases, les chercheurs ont laissé Atom2Vec à ses propres circuits. En utilisant des méthodes et des processus liés à ceux du traitement automatique du langage naturel, principalement l’idée que la nature des mots peut être comprise en regardant d’autres mots autour d’elle, l’IA a réussi à regrouper les éléments par leurs propriétés chimiques.
Image d’entête de Claire Scully/ Université Stanford.
Il n’a fallu que quelques heures à Atom2Vec pour réaliser l’exploit. En gros, il a recréé le tableau périodique des éléments, l’une des plus grandes réalisations en chimie. Il nous a fallu près d’un siècle d’essais et d’erreurs pour faire la même chose.
Notre tableau périodique des éléments.
Le tableau périodique des éléments a été initialement conçu par Dmitri Mendeleev au milieu du XIXe siècle, bien avant que bon nombre des éléments que nous connaissons aujourd’hui n’aient été découverts, et certainement avant même qu’il n’y ait un soupçon de mécanique quantique et de relativité qui se cachait au-delà des frontières de la physique classique. Mendeleev a reconnu que certains éléments se retrouvaient dans des groupes avec des caractéristiques chimiques similaires, et cela a établi un modèle périodique (d’où le nom) aux éléments au fur et à mesure qu’ils passaient d’éléments légers comme l’hydrogène et l’hélium, à des éléments de plus en plus lourds. En fait, Mendeleev pouvait prédire les propriétés et les caractéristiques très spécifiques des éléments non encore découverts en raison des espaces vides dans son tableau inachevé. Bon nombre de ces prédictions se sont avérées correctes lorsque les éléments remplissant les espaces vides ont finalement été découverts.
Selon a déclaré Shou-Cheng Zhang, directeur de l’étude à la Stanford School of Humanities and Sciences (université Stanford/ États-Unis) :
Nous voulions savoir si une IA peut être assez intelligente pour découvrir le tableau périodique par elle-même, et notre équipe a montré qu’elle peut le faire.
L’équipe de Zhang a conçu Atom2Vec à partir d’une plateforme d’intelligence artificielle (Word2Vec) que Google a construite pour analyser le langage naturel. Le logiciel convertit les mots individuels en vecteurs (codes numériques). Il analyse ensuite ces vecteurs pour estimer la probabilité qu’un mot particulier apparaisse dans un texte en fonction de la présence d’autres mots.
Le mot « roi » par exemple est souvent accompagné de « reine », et les mots « homme » et « femme » apparaissent souvent ensemble. Word2Vec travaille avec ces co-appartenances et apprend que, mathématiquement, « roi = une reine moins une femme plus un homme », explique Zhang. Dans le même ordre d’idées, l’équipe a donné à Atom2Vec tous les composés chimiques connus (NaCl, KCl, etc.) au lieu d’échantillons de texte.
Cela a étonnamment bien fonctionné. Même à partir de cette taille d’échantillon relativement petite, le programme a compris que le potassium (K) et le sodium (Na) doivent être chimiquement similaires, car les deux se lient au chlore (Cl). Grâce à un processus similaire, Atom2Vec a établi des relations chimiques entre toutes les espèces du tableau périodique. Zhang espère que dans le futur, les chercheurs utiliseront Atom2Vec pour découvrir et concevoir de nouveaux matériaux et de rajouter :
Pour ce projet, le programme d’IA n’était pas supervisé, mais vous pourriez imaginer lui donner un objectif et lui demander de trouver, par exemple, un matériau très efficace pour convertir la lumière du soleil en énergie.
Image d’entête, à partir de l’étude : (A) montre les vecteurs atomiques de 34 éléments du groupe principal et leur regroupement hiérarchique basé sur la distance. La couleur dans chaque cellule représente la valeur du vecteur sur cette dimension. (Zhou et col./ PNAS)
Aussi impressionnant que soit ce résultat, Zhang précise que ce n’est qu’un premier pas. La tâche ultime est plus ambitieuse, Zhang espère remplacer le test de Turing, l’étalon d’or de l’intelligence des machines. Pour réussir le test de Turing, une machine doit être capable de répondre à des questions écrites de telle sorte que les utilisateurs ne soupçonnent pas qu’ils discutent avec une machine. En d’autres termes, une machine sera considérée comme aussi intelligente qu’un humain si elle nous semble humaine.
Cependant, Zhang pense que le test est imparfait, car il est trop subjectif.
Les humains sont le produit de l’évolution et nos esprits sont encombrés de toutes sortes d’irrationalités. Pour qu’une IA réussisse le test de Turing, il faudrait qu’elle reproduise toutes nos irrationalités humaines. C’est très difficile à faire, et ce n’est pas une bonne utilisation du temps des programmeurs.
Il espère sortir le facteur humain de l’équation, en faisant en sorte que l’intelligence artificielle tente de découvrir de nouvelles lois de la nature. Cependant, personne ne nait instruit, pas même les machines, alors Zhang vérifie d’abord si les IA peuvent accéder aux découvertes les plus importantes que nous avons réalisées sans aide. En recréant le tableau périodique, Atom2Vec a atteint cet objectif.
L’étude publiée dans PNAS : Learning atoms for materials discovery et présentée sur le site de l’université Stanford : Stanford AI recreates chemistry’s periodic table of elements.
Waouh, cet article ne paye pas de mine mais honnête je suis bouche bée !
J’ai déjà vu des choses vraiment impressionnantes de la part des IA utilisant le deep learning et les réseaux neuronaux, mais souvent pour du loisir (un ordi qui joue à un jeu tout seul par ex.). Mais alors là !
On peut raisonnablement penser que les machines pourront effectivement inventer/découvrir des choses utiles que l’on ne connait pas encore.