L’intelligence artificielle AlphaFold prédit les structures de presque toutes les protéines du corps humain
L‘année dernière, DeepMind, une entreprise britannique spécialisée dans l’intelligence artificielle (IA), a proposé une solution convaincante à un problème scientifique vieux de 50 ans, en démontrant comment son IA AlphaFold pouvait prédire les structures 3D de protéines uniques, jetant ainsi les bases d’une nouvelle ère de découvertes biologiques. La société a continué à développer ces bases en partageant désormais les structures prédites de presque toutes les protéines du corps humain, ce qui va accélérer les efforts de recherche dans tous les domaines, de la résistance aux antibiotiques aux traitements contre le cancer, et bien plus encore.
Précédemment :
En tant que composants essentiels de tous les êtres vivants sur Terre, connaître les formes complexes des différentes protéines individuelles peut nous aider à comprendre ce qu’elles font et comment elles peuvent être manipulées de manière bénéfique, par exemple par des médicaments qui s’attaquent aux maladies humaines. Mais elles commencent toutes par des chaînes unidimensionnelles d’acides aminés qui se plient en une gamme presque infinie de structures 3D très complexes. L’utilisation de ces chaînes d’acides aminés pour prédire à quoi ressemblera la structure finale est connue sous le nom de « problème du repliement des protéines« , et c’est un problème auquel les scientifiques sont confrontés depuis le début des années 1970.
L’IA AlphaFold de DeepMind a été développée pour résoudre ce problème grâce à la puissance de l’informatique moderne. Le système est entraîné sur des structures protéiques accessibles au public qui ont déjà été déterminées par des expériences scientifiques. L’année dernière, il a montré comment il pouvait être utilisé pour résoudre des structures protéiques sur lesquelles les scientifiques travaillaient depuis de nombreuses années.
Déterminer les replis subtils des protéines prend traditionnellement des années, mais l’IA DeepMind accélère le processus. (DeepMind)
Qualifié “d’étonnamment précis », “d’un élément qui change la donne » et “d’avancée stupéfiante », AlphaFold est considéré comme une solution au problème du repliement des protéines, vieux de 50 ans, et ouvre un nouveau chapitre dans la recherche biologique. Il pourrait aider les scientifiques à identifier beaucoup plus rapidement les protéines défaillantes et les raisons pour lesquelles elles provoquent certaines maladies, ou accélérer considérablement le développement de médicaments pour les traiter. Des enzymes pourraient être développées plus rapidement pour dégrader les déchets plastiques, et les nouveaux virus pourraient être combattus plus efficacement en cartographiant les structures des protéines à pointe, par exemple.
Moins d’un an après, nous voyons déjà cette technologie commencer à redéfinir le monde de la recherche scientifique. La semaine dernière, une autre équipe de chercheurs de l’université de Washington a fait la démonstration d’un logiciel semblable à AlphaFold, appelé RoseTTAFold. Il pouvait prédire les structures des protéines en 10 minutes seulement avec un seul ordinateur de jeu et il a été mis gratuitement à disposition en ligne.
L’équipe de DeepMind s’est également efforcée de rendre son outil plus accessible. La semaine dernière, elle a publié un article expliquant en détail comment le système a été développé et elle a partagé le code source sur GitHub. Aujourd’hui, elle a publié son catalogue de prédictions pour presque toutes les protéines du corps humain, connu sous le nom de protéome humain.
Ce catalogue représente 98,5 % des protéines humaines, soit environ 20 000 au total. En outre, l’équipe a donné un accès libre aux protéomes de 20 autres organismes d’intérêt, dont la mouche du vinaigre, la souris, la levure et l’Escherichia Coli, ce qui représente un total de plus de 350 000 structures protéiques. L’équipe prévoit de poursuivre sur cette lancée dans les mois à venir en élargissant cette collection pour inclure les plus de 100 millions de protéines connues de la science, pour aboutir à ce que DeepMind appelle un « véritable almanach protéique du monde ».
Selon le professeur Ewan Birney, directeur général adjoint du Laboratoire européen de biologie moléculaire :
Ce sera l’un des ensembles de données les plus importants depuis la cartographie du génome humain.
L’étude publiée dans Nature : Highly accurate protein structure prediction for the human proteome et présentée sur le site du DeepMind : Putting the power of AlphaFold into the world’s hands.