Un robot basé sur l'IA apprend à jouer à un jeu de Jenga
- Des chercheurs développent un bras robotique qui utilise le toucher et la vision pour apprendre le jeu de Jenga.
- La méthode d'apprentissage automatique développée dans ce travail pourrait aider le robot à assembler des produits de consommation et à effectuer d'autres tâches qui nécessitent une interaction physique minutieuse.
Jenga est un jeu complexe qui nécessite une coordination et une stratégie œil-main précises. En tant qu'humains, nous intégrons de manière transparente nos sens de la vue et du toucher pour maîtriser ce jeu. Les robots, en revanche, ne possèdent pas encore ce niveau de sophistication.
La plupart des systèmes d'apprentissage robotique n'utilisent que des données visuelles, sans sens du toucher, ce qui limite fondamentalement leur capacité à se renseigner sur le monde extérieur. Les algorithmes d'apprentissage existants basés sur des techniques d'apprentissage par renforcement sans modèle ont peu ou pas de capacité à exploiter les connaissances sur les objets physiques, les contacts ou les forces.
Récemment, des chercheurs du MCube Lab du MIT ont développé un algorithme pour reproduire cette capacité à l'aide d'un robot. Contrairement aux techniques conventionnelles d'apprentissage automatique qui utilisent des ensembles de données massifs pour évaluer leur prochain meilleur mouvement, ce robot apprend et exploite un modèle hiérarchique qui permet une extraction douce et précise des pièces.
Robot jouant Jenga
Le robot est équipé d'une caméra RVB externe, d'une pince souple et d'un poignet à détection de force. Tous ces composants permettent au robot d'observer et de sentir la tour Jenga et ses blocs individuels.
Les chercheurs ont personnalisé un bras robotique industriel ABB IRB 120 et installé une tour Jenga à sa portée. Alors que le bras pousse doucement contre un bloc, un ordinateur capture un retour tactile et visuel de son brassard et de sa caméra, et compare ces mesures avec les mouvements précédents du robot.
Référence :ScienceRobotics | doi:10.1126/scirobotics.aav3123 | MIT
Ce modèle permet au robot d'estimer avec précision l'état d'une pièce, de simuler les prochains mouvements possibles et de décider d'un mouvement favorable. En temps réel, la machine apprend s'il faut continuer à pousser le bloc ou passer à un nouveau, afin d'empêcher la structure de s'effondrer.
C'est plus difficile que de développer l'IA pour les échecs ou le Go, car le jeu de Jenga nécessite des compétences physiques de base telles que tirer, pousser, placer et aligner des blocs individuels.
Le robot développé dans ce travail identifie efficacement quand un bloc se sent bloqué ou libre et décide comment l'extraire en utilisant beaucoup moins de données. Il est entraîné sur près de 300 tentatives (au lieu de dizaines de milliers de tentatives). Les tentatives de résultats et de mesures similaires sont regroupées en groupes et chaque groupe représente des comportements de bloc spécifiques.
Pour chaque cluster de données, la machine a développé un modèle pour estimer le comportement d'un bloc en fonction de ses mesures tactiles et visuelles actuelles. Cette stratégie de regroupement, inspirée de la façon naturelle dont les humains apprennent, augmente considérablement l'efficacité du robot avec laquelle il peut apprendre à jouer.
Applications
Cette méthode est un exemple réussi d'intelligence artificielle se déplaçant dans le monde physique. Au fur et à mesure que le robot interagit avec son environnement, il apprend certaines des compétences de base qui définissent la manipulation humaine.
Lire : Dactyl :une main de robot semblable à un humain qui utilise l'IA pour atteindre une dextérité sans précédent
Ce système d'apprentissage tactile peut être appliqué à des tâches au-delà du jeu de Jenga, en particulier les tâches qui nécessitent une interaction physique prudente. Par exemple, assembler des produits de consommation et séparer les matières recyclables des déchets mis en décharge.
Dans une chaîne de montage de smartphones et d'ordinateurs portables, par exemple, la plupart des étapes nécessitent des actions tactiles et forcées plutôt qu'une simple vision, et cette technologie pourrait considérablement améliorer ces chaînes de montage.
Technologie industrielle