Fabrication industrielle
Internet des objets industriel | Matériaux industriels | Entretien et réparation d'équipement | Programmation industrielle |
home  MfgRobots >> Fabrication industrielle >  >> Manufacturing Technology >> Technologie industrielle

L'IA peut désormais calculer la structure 3D de n'importe quelle protéine

Les protéines sont l'un des principaux éléments constitutifs du corps humain. Il construit et maintient les tissus. Chimiquement, il est composé d'acides aminés - des composés organiques constitués d'hydrogène, de carbone, d'oxygène, d'azote ou de soufre.

Les protéines exécutent presque tous les processus biologiques fondamentaux essentiels à la vie en se repliant dans des structures tridimensionnelles précises qui contrôlent leur interaction avec d'autres molécules.

Étant donné que la forme d'une protéine détermine sa fonction et son rôle dans diverses maladies, il est important d'étudier et de prédire leurs structures pour développer des médicaments qui sauvent et changent la vie.

Cependant, ce n'est pas aussi facile qu'il y paraît. Au cours des 5 dernières décennies, le repliement des protéines est resté l'un des problèmes les plus difficiles pour les biochimistes. De nombreuses méthodes de calcul ont été développées, en particulier ces dernières années, pour prédire comment les protéines se replient, mais une carte séquence-structure explicite n'a pas encore été réalisée.

Aujourd'hui, des chercheurs de la Harvard Medical School ont utilisé un modèle d'apprentissage en profondeur (une forme d'intelligence artificielle) pour déterminer la structure 3D d'une protéine en fonction de sa séquence d'acides aminés. Il surpasse les techniques de pointe existantes de 6 à 7 ordres de grandeur en termes de vitesse.

Appliquer l'apprentissage en profondeur différentiable de bout en bout

Les algorithmes avancés utilisent une technique de force brute pour simuler la physique complexe des interactions d'acides aminés et déterminer la structure des protéines. Pour réduire les frais de calcul, ces algorithmes mappent de nouvelles séquences sur des modèles préconçus qui représentent des structures protéiques précédemment déterminées.

Certains projets d'IA comme AlphaFold de Google analysent une quantité massive de données génomiques contenant le plan de séquences protéiques. Cependant, ces méthodes n'estiment pas les structures basées uniquement sur la séquence d'acides aminés. Ils ne peuvent pas déterminer les protéines évolutives uniques (structures de protéines qui n'ont jamais été étudiées dans le passé).

Par conséquent, l'équipe de recherche a utilisé une technique d'apprentissage en profondeur différenciable de bout en bout, qui s'est déjà avérée efficace dans certaines des applications les plus populaires, notamment Google Traduction et Siri d'Apple.

Référence :Systèmes cellulaires | doi:10.1016/j.cels.2019.03.006 | Faculté de médecine de Harvard 

Ce système d'apprentissage en profondeur appelé réseau géométrique récurrent met l'accent sur les propriétés clés du repliement des protéines. Il est entraîné sur des milliers de séquences et de structures protéiques prédéterminées.

Pour chaque acide aminé, l'algorithme calcule l'angle des liaisons chimiques qui relient l'acide à ses voisins, ainsi que l'angle de rotation autour de ces liaisons chimiques.

Une simulation visuelle de la façon dont le réseau calcule l'angle et l'angle de rotation des liaisons chimiques autour de ces liaisons pour construire une structure de la protéine. | Crédit : Mohammed AlQuraishi 

Le réseau de neurones effectue ces calculs (chaque itération est affinée par l'emplacement relatif de chaque autre acide aminé) jusqu'à ce que la structure soit terminée. Le système vérifie ensuite la précision de son résultat en le comparant à la structure réelle de la protéine (obtenue à partir d'observations directes).

Résultats

Ce processus est répété pour plusieurs protéines connues différentes et la précision du système augmente à chaque itération. La formation du réseau peut prendre des mois, mais une fois la formation terminée, le modèle peut facilement surpasser toutes les techniques existantes pour estimer les structures protéiques pour lesquelles il n'y a aucune connaissance préalable.

Pourtant, la précision du modèle n'est pas suffisante pour résoudre la structure atomique complète d'une protéine. Ainsi, il n'est pas prêt à être utilisé dans la conception ou la découverte de médicaments.

Lire :Une nouvelle méthode utilise un appareil photo pour téléphone portable pour mesurer des protéines extrêmement rares dans le sang

Pour l'instant, il peut compléter d'autres techniques pour prédire une classe beaucoup plus large de structures protéiques qu'auparavant. Il existe de nombreuses possibilités d'améliorer le modèle en intégrant les lois de la physique et de la chimie. Si vous voulez l'essayer vous-même, le code et les résultats sont disponibles sur GitHub.


Technologie industrielle

  1. L'IA peut désormais détecter et cartographier les implantations informelles dans le monde
  2. Les lunettes peuvent désormais surveiller le diabète à travers les larmes
  3. L'IA peut désormais naviguer dans des environnements inconnus sans carte
  4. Le nouvel ordinateur ADN peut calculer jusqu'à 900 racines carrées
  5. L'IA peut désormais composer des mouvements de danse réalistes et variés
  6. N'importe quel jour peut être un jour de fabrication !
  7. L'usine « intelligente » peut-elle relancer la productivité de la fabrication aux États-Unis ?
  8. Comment les DSI peuvent limiter le risque d'externalisation informatique
  9. Les petits épiciers peuvent-ils survivre au jeu du commerce électronique ?