Fabrication industrielle
Internet des objets industriel | Matériaux industriels | Entretien et réparation d'équipement | Programmation industrielle |
home  MfgRobots >> Fabrication industrielle >  >> Manufacturing Technology >> Système de contrôle d'automatisation

La puissance de l'IA dans l'automatisation industrielle

Les approches les plus avancées des systèmes robotiques entièrement intelligents

L'IA (intelligence artificielle) permet l'automatisation d'un nombre croissant de processus métier et d'applications industrielles. La portée et le rythme de l'automatisation intelligente dépendent directement des progrès de l'IA et, à ce titre, ont fait des pas de géant ces dernières années. Combinée à une vision artificielle 3D puissante, l'IA permet aux robots de reconnaître, de localiser et de manipuler tout type d'objet et ainsi d'automatiser des tâches qui seraient trop dangereuses, monotones ou exigeantes pour l'homme.

Mais qu'entend-on par IA dans l'automatisation industrielle, comment fonctionne-t-elle et quelles possibilités ouvre-t-elle aux usines et aux entreprises en quête de modernité, d'innovation et d'augmentation de la productivité ? Tout d'abord, regardons les tout débuts de l'IA et son développement progressif.

Des premières architectures aux réseaux de neurones convolutifs

Le terme IA peut représenter un certain nombre de capacités et de processus de la machine - des statistiques simples aux arbres de décision en passant par les réseaux de neurones, tels que les réseaux de neurones convolutifs, ou même des approches plus avancées telles que l'apprentissage par renforcement.

L'histoire du développement de l'IA a vu plusieurs approches mais les réseaux de neurones se sont révélés les plus prometteurs et intéressants grâce à leur capacité à généraliser.

Dans les années 1990 et au début des années 2000, les réseaux de neurones ont reçu une grande attention grâce aux premières applications réussies de reconnaissance de caractères qui incluaient la lecture de nombres manuscrits dans les chèques bancaires et les codes postaux de lettre. Ces réseaux de neurones ont été formés sur un soi-disant ensemble de données MNIST (pour Institut national modifié des normes et de la technologie ), qui est une collection de chiffres manuscrits de 0 à 9 utilisés dans l'apprentissage automatique et la vision artificielle pour la formation des systèmes de traitement d'images. L'ensemble de données MNIST a servi de base pour l'analyse comparative des algorithmes de classification et est encore utilisé aujourd'hui à des fins de formation et de test.

Bien que ces réseaux de neurones classiques soient capables d'apprendre pratiquement n'importe quoi, ils représentent une ancienne architecture entièrement connectée et les former demande beaucoup de temps et d'efforts . En effet, tous les neurones d'une couche sont entièrement connectés aux neurones de la couche suivante, ce qui signifie un grand nombre de paramètres à apprendre, augmentant avec la taille d'une image. Bien que les performances des ordinateurs se soient améliorées au fil du temps, il faut encore beaucoup de temps pour entraîner la reconnaissance des images, même les plus petites.

Un tournant dans le développement de l'IA a été marquée par l'introduction des réseaux de neurones à convolution (CNN) . Les CNN sont principalement utilisés pour analyser l'imagerie visuelle, y compris la classification d'images ou la reconnaissance de formes , et forment l'épine dorsale de nombreux systèmes de vision industrielle modernes. Un autre domaine d'application principal est le traitement du langage naturel.

Un CNN est, très vaguement parlant, inspiré par le système de cortex visuel dans le cerveau. L'idée principale derrière les CNN n'est pas de connecter tous les neurones entre eux, comme c'est le cas avec les réseaux entièrement connectés, mais uniquement avec les neurones voisins pour créer une proximité, car les entrées voisines, telles que les pixels, transportent des informations connexes. Cela signifie que les CNN peuvent avoir plusieurs couches et les neurones d'une couche ne sont connectés qu'aux neurones de la couche suivante qui leur sont spatialement proches . Cela réduit la complexité, le nombre de neurones dans le réseau, et par conséquent aussi le nombre de paramètres à apprendre. Grâce à cela, les CNN sont plus rapides à former, nécessitent moins d'échantillons et peuvent également être appliqués à des images plus grandes.

Le terme "convolutionnel" fait référence au processus de filtrage par lequel les CNN détectent des modèles. Les calques individuels convoluent , c'est-à-dire combiner , l'entrée et transmettre le résultat à la couche suivante.

Les progrès dans le développement des CNN ont également été accélérés par les progrès des unités de traitement graphique (GPU). Leurs performances et leur puissance de calcul se sont considérablement améliorées au cours des dernières années, ouvrant de nouvelles possibilités pour la formation des CNN.

L'un des leaders les plus reconnus dans le domaine de l'IA, souvent appelé le "parrain de l'IA", est Geoffrey Hinton . Il est diplômé en psychologie expérimentale et en intelligence artificielle. Cette combinaison lui a donné un excellent aperçu de la façon de former des réseaux de neurones artificiels.

En 2012, son élève Alex Krizhevsky a marqué un autre tournant dans l'IA lorsqu'il a créé un CNN capable d'imiter la façon dont le cerveau humain reconnaît les objets. Le CNN a été nommé l'AlexNet et pour la première fois dans l'histoire a permis à une machine d'identifier des objets comme une personne.

Cette percée a popularisé les réseaux de neurones convolutifs et a montré la vaste gamme d'applications où les CNN pourraient être utilisés.

Entraînement d'un réseau de neurones convolutifs

Dans la reconnaissance d'objets, il est important qu'un CNN ait une propriété appelée invariance . Cela signifie qu'il est invariant à la translation, au point de vue, à la taille ou à l'éclairage pour pouvoir interpréter les modèles d'entrée et classer les objets indépendamment de l'endroit et de la manière dont ils sont placés dans une image. Pour y parvenir, CNN doit être formé sur un certain nombre d'exemples. L'augmentation des données est l'une des meilleures pratiques pour augmenter la quantité de données pertinentes dans un ensemble de données. .

L'augmentation consiste à modifier les données d'entrée, c'est-à-dire l'image d'origine, pour en générer plusieurs autres versions légèrement modifiées. Les techniques d'augmentation comprennent le retournement horizontal ou vertical, la rotation, la mise à l'échelle, le recadrage, le déplacement de l'image le long de la direction X ou Y, etc.

La formation d'un CNN sur des données modifiées rend ses neurones immunisés contre de telles augmentations et l'empêche d'apprendre des modèles non pertinents. Un perroquet retourné sera donc toujours reconnu comme un perroquet.

Ce qui est très pratique ici, c'est le soi-disant apprentissage par transfert . Pour éliminer la quantité de données d'apprentissage, on peut utiliser un réseau existant et déjà formé et appliquer certains de ses filtres pour la reconnaissance de nouveaux types d'objets. Par exemple, un réseau entraîné pour la reconnaissance des chiens peut également être utilisé pour la reconnaissance des chats en conservant certains de ses filtres et en n'en modifiant qu'une certaine partie. Cela signifie que le réseau s'adaptera à la reconnaissance des chats.

Avantages des réseaux de neurones convolutionnels modulaires

La grande valeur des CNN réside dans leur architecture et le fait que les modules individuels examinent des blocs d'images uniques. Les modules n'ont pas besoin d'être formés simultanément et peuvent être facilement reliés entre eux. La combinaison de ces modules bien entraînés a donné naissance à des architectures complexes pouvant être utilisées pour la segmentation .

Contrairement à AlexNet, qui ne peut reconnaître que ce qui est dans l'image, ces CNN complexes peuvent effectuer une segmentation d'objet et définir l'emplacement de l'objet dans l'image .

Cette modularité permet d'utiliser différents canaux d'entrée, ce qui signifie que si le CNN a été utilisé pour des données en noir et blanc, il peut également être utilisé pour des données en couleur, et s'il a été utilisé pour des données en couleur, il peut être étendu par des informations de profondeur. L'ajout d'informations supplémentaires améliore les performances de CNN , which includes increased accuracy and better recognition of objects and their positions.

From object recognition to smart automation solutions

Based on the above features and characteristics of convolutional neural networks, Photoneo took CNNs as a basis for its advanced robotic intelligence systems and automation solutions .

Photoneo’s CNN works with black &white data, color data, as well as depth information. The algorithms are trained on a large dataset of objects and if they come across new types of items, they can quickly generalize, that is, recognize and classify objects which it has not “seen” before.

Let’s take the concept of a box, for instance. The algorithms were trained on a large dataset of boxes so they understand that a box has a certain amount of faces, edges, and vertices. This principle will also work for boxes that the algorithms have not come across before, even squeezed or damaged ones. The greatest value of AI lies in the fact that it can generalize concepts that it was trained on without further retraining.

This enables Photoneo systems to recognize items of various shapes, sizes, colors, or materials – a robotic ability used for the localization and handling of mixed objects, including organic items such as fruit or fish, sorting of parcels, unloading of pallets laden with boxes, and many other industrial applications.

It might also happen that the algorithms come across objects with features that are fundamentally different from those the algorithms were trained on. This might confuse the CNN and cause a decrease in its performance. What can be done to solve this problem is either to prevent it by expecting exotic objects or to have a good retraining system. In the latter case, the performance will be temporarily lower but the CNN will be retrained to reach full performance rather quickly.

In case a customer needs to pick unusual items or non-commercial products such as industrial components, the CNN can be trained on a specific dataset containing these exotic items .

When it comes to the realization of a customer project, the customer receives Photoneo’s CNN for pilot testing and a feasibility study to ensure that the network can be used for that particular application. This CNN can then be improved and further trained on images from the pilot phase of the project, which will provide greater variability.

The greatest challenge in AI-powered object recognition and picking

The greatest challenge could also be described as the last puzzle piece that was missing in the range of pickable objects. This last piece was bags .

The difficulty lies in the nature of bags since they are extremely deformable and full of wrinkles, folds, and other irregularities. Despite the challenges that bags pose to AI, Photoneo developed a system that is able to recognize and pick bags, may they be full, half-empty, colored, transparent, or semi-transparent. This task is often challenging even for the human eye, which may find it difficult to recognize boundaries between bags that are chaotically placed in a container, especially if they are transparent.

However, good recognition and localization of bags are only part of the precondition for successful object picking. The other part relates to the mechanical side of an application – the robot gripper. The fact that bags are full of folds and wrinkles increases the risk that they will fall off the gripper. This risk can be prevented by using an appropriate vacuum gripper with feedback.

Future developments of AI

Despite significant advancements that have been made in AI in recent years, the field still offers a vast space for new achievements. For instance, so-called reinforcement learning receives great attention as it seems to be very promising in suggesting complex movements, for instance allowing a robot to adjust the position of an item before grasping it.

Reinforcement learning is not only able to cope with object recognition but also with mechanical problems of an application. This means that it not only enables a system to recognize items but also assess the individual steps of a robot action on the basis of rewards and punishments and “calculate” the chance of success or failure . In other words, AI algorithms are trained to make a sequence of decisions that will lead to actions maximizing the total reward. An example of the power of reinforcement learning is mastering and winning the board game of Go.

Despite its immense potential, reinforcement learning is closely linked to the environment it is set in and to the limitations it may pose. For example, the deployed gripper and its functionalities and limitations will always influence a system’s overall performance.

AI is the main driver of emerging technologies and its developments will be very dependent on a number of factors, including market demands, customer expectations, competition, and many others.


Système de contrôle d'automatisation

  1. Libérer la puissance de l'Internet des objets industriel
  2. Les effets positifs de l'automatisation agricole
  3. 4 façons de mettre en œuvre l'automatisation industrielle
  4. Tendances de l'automatisation industrielle
  5. Comment choisir un contrôleur d'automatisation industrielle
  6. L'automatisation industrielle
  7. Pourquoi et comment l'automatisation industrielle est l'avenir
  8. L'alimentation sans fil RF libère l'omniprésence des réseaux de capteurs
  9. STAEDTLER :la valeur de l'automatisation dans la fabrication