Fabrication industrielle
Internet des objets industriel | Matériaux industriels | Entretien et réparation d'équipement | Programmation industrielle |
home  MfgRobots >> Fabrication industrielle >  >> Manufacturing Technology >> Système de contrôle d'automatisation

Tirer parti de l'écosystème de compréhension des documents

La compréhension des documents vise à libérer les données piégées dans les documents pour accorder à votre organisation une précision beaucoup plus élevée des données extraites, une productivité accrue et un retour sur investissement croissant grâce à l'automatisation des processus robotiques (RPA). Il se situe à l'intersection du traitement des documents et de l'intelligence artificielle (IA) qui, ensemble, contribuent à un avenir où presque tout peut être automatisé.

L'écosystème de compréhension de documents comprend des technologies capables d'interpréter les informations et la signification d'un large éventail de types de documents, y compris l'écriture manuscrite, les cases à cocher et les tampons. L'apprentissage automatique (ML) stimule l'innovation continue dans la compréhension des documents, qui est l'un des domaines d'automatisation à la croissance la plus rapide.

Les organisations peuvent déjà travailler avec des solutions ou des fournisseurs spécifiques. Pourtant, ils peuvent avoir besoin d'autres technologies ou d'une nouvelle expertise pour étendre la compréhension des documents à d'autres fonctions de l'entreprise. Il peut être difficile de trouver un fournisseur proposant une solution universelle compatible avec tous les types de documents. Ils se concentrent généralement sur des types particuliers de documents ou d'industries, tels que l'assurance, la finance et la santé. Il existe également des fournisseurs qui proposent des solutions basées sur ML, telles que des modèles pré-formés pour des documents spécifiques. Pourtant, ces modèles ne peuvent pas être facilement modifiés pour s'adapter à des documents en dehors de ces domaines.

Il est actuellement difficile de trouver un fournisseur offrant une solution universelle qui fonctionnera avec n'importe quel document imaginable. À son tour, UiPath offre aux entreprises un moyen de relever les défis et les possibilités du traitement automatisé des documents. Pour commencer, vous pouvez tester nos fonctionnalités d'IA natives via l'essai UiPath Enterprise.

Les capacités de la plate-forme UiPath Enterprise RPA sont améliorées par des offres partenaires complémentaires permettant un traitement fluide des documents de bout en bout - celles-ci sont disponibles sur UiPath Marketplace. La place de marché offre un écosystème ouvert avec des solutions partenaires qui, combinées à la plate-forme UiPath RPA, peuvent répondre à un large éventail de cas d'utilisation.

Examinons de plus près ces technologies écosystémiques et les principaux fournisseurs qui les proposent.

Plusieurs technologies peuvent libérer la puissance de la compréhension des documents

Voici quelques-unes des technologies les plus couramment utilisées dans la compréhension de documents, ainsi que les partenaires UiPath qui créent des solutions autour d'elles :

Reconnaissance optique de caractères (OCR)

L'OCR convertit les images de texte dactylographié, manuscrit ou imprimé en texte codé par machine qui peut être traité ultérieurement pour extraire les données souhaitées. La technologie extrait également des informations sur la mise en page et la structure du contenu. Vous avez peut-être parfois été ralenti en travaillant avec des documents PDF dans lesquels vous ne pouvez pas copier de texte ou appliquer une recherche car les pages PDF sont essentiellement des images. De même, vous pouvez avoir une numérisation, une photo ou une capture d'écran d'un reçu, par exemple, dans des formats graphiques typiques tels que JPEG ou TIFF. L'OCR peut facilement collecter toutes les informations nécessaires à partir de ces fichiers sans qu'un humain ait besoin de lire tous les documents par lui-même.

La plupart des moteurs OCR les plus connus du marché sont intégrés à UiPath. Ceux-ci incluent ABBYY FineReader, Tesseract (un OCR open source fourni par Google), Kofax OmniPage, Microsoft OCR et Google OCR. De plus, UiPath Document OCR a récemment été publié comme un autre excellent choix pour les clients.

Extracteurs basés sur des modèles (TBE)

Les TBE extraient les données en utilisant des règles fixes qui sont appliquées aux modèles créés par un utilisateur ou une machine. Les TBE peuvent ne pas fonctionner pour les documents dont la structure change fréquemment ou nécessite différentes variations de modèle. Cela signifie que ce n'est pas une option lorsque vous travaillez avec de nombreuses organisations différentes et que vous traitez avec divers modèles de factures ou de reçus qu'elles envoient. Dans le même temps, la technologie est parfaitement adaptée à la gestion d'un nombre relativement restreint de modèles de documents stables. N'hésitez pas à vous lancer lorsque vous disposez d'un ensemble prédéfini de modèles fixes et qu'aucune exclusion n'est prévue. Lorsqu'un changement de format de document est nécessaire, il est facile de modifier manuellement le modèle.

De nombreux fournisseurs proposent des TBE. Lors de l'évaluation de la solution à choisir, vous devez faire attention à la facilité de configuration d'un modèle et à la façon dont les résultats de l'extraction dépendent de la qualité de l'image. Certaines des meilleures entreprises proposent des technologies qui créent les modèles de manière semi-automatique en utilisant un processus humain dans la boucle qui ne fait que confirmer le choix.

Un excellent exemple de TBE est ABBYY FlexiCapture, qui est intégré à UiPath Studio. Il existe également un extracteur de modèle UiPath qui est disponible dans le cadre de UiPath Document Understanding.

Extracteurs d'apprentissage automatique basés sur l'apprentissage supervisé (SMLE)

Les SMLE peuvent être utilisés pour des documents structurés et semi-structurés. Ces derniers peuvent ne pas avoir une mise en page stricte comme les documents structurés mais peuvent inclure des contenus similaires. Un bon exemple est celui des factures et des bons de commande. Les SMLE fonctionnent en étiquetant un ensemble d'exemples de documents, c'est-à-dire en associant les éléments de données à extraire à la zone du document d'où les données sont extraites.

Actuellement, UiPath dispose d'extracteurs basés sur ML pour les factures, les reçus et les bons de commande. D'autres modèles pré-formés seront bientôt disponibles. UiPath est également intégré à ABBYY Flexicapture Distributed et Flexicapture for Invoices qui exploitent des modèles ML pré-formés pour les factures et documents similaires. De plus, UiPath est intégré à Hyperscience, Ephesoft, Vidado, Rossum, Omnius, Microsoft Form Recognizer et Amazon Textract. Toutes les intégrations proposent des techniques pour les documents structurés et semi-structurés.

Lors de l'examen des options SMLE, demandez au fournisseur combien d'échantillons sont nécessaires former les modèles. Si le nombre est important, le processus peut entraîner un coût élevé en raison des tâches d'étiquetage et du besoin de nombreux échantillons.

Apprentissage non supervisé (USL)

Cette technique consiste à analyser un jeu de données sans nécessiter de pré-étiquetage des données. USL utilise des modèles pré-formés ou différentes représentations de connaissances conviviales pour traiter des documents non structurés. Les cas d'utilisation courants incluent l'analyse des états financiers, des contrats et des e-mails.

UiPath a plusieurs partenaires proposant des solutions USL, notamment Indico, SortSpoke, Botminds AI Technologies et Xtracta. Indico, par exemple, propose un outil de labellisation assistée par ordinateur qui propose des libellés associés aux données des documents. Tout ce que l'utilisateur doit faire est de les approuver ou de les écraser.

Traitement du langage naturel (TAL)

Les technologies NLP aident les ordinateurs à comprendre le langage humain. La PNL est souvent combinée avec d'autres technologies pour effectuer une gamme de tâches. Il permet aux organisations d'exécuter l'analyse de texte, l'extraction d'entités et d'automatiser les processus en définissant l'intention dans des documents non structurés comme les e-mails. Si vous souhaitez extraire la date de début et la date de fin d'un document non structuré, vous devez être en mesure de mapper la chronologie de travail car de nombreuses dates sont synonymes. La PNL vous aide à le faire car elle peut déterminer et analyser les synonymes. De plus, il peut s'agir d'analyser le sentiment d'un texte, c'est-à-dire de définir s'il est positif, négatif ou neutre. Cela peut être particulièrement utile pour interpréter le contenu des actualités, des médias sociaux ou de la correspondance. Les partenaires et technologies NLP intégrés à UiPath incluent Expert System, Amazon Comprehend et le Stanford NLP Group.

Alternatives émergentes :externalisation des processus métier et présence humaine

Outre les technologies et les entreprises établies répertoriées ci-dessus, on assiste à l'émergence de fournisseurs proposant des processus d'externalisation des processus métier (BPO) et d'intervention humaine dans la boucle (HITL) pour améliorer la compréhension des documents.

Par exemple, Ocrolus et Contract Wrangler disposent de puissantes technologies basées sur ML pour la compréhension des documents. Pourtant, ils engagent une force humaine externalisée qui aide à corriger les résultats d'extraction de documents qui n'atteignent pas le seuil de précision souhaité. Les deux sociétés sont perturbatrices car elles garantissent une précision allant jusqu'à 99,99 % et un engagement de délai de livraison. Bien sûr, une plus grande précision et des délais plus courts peuvent entraîner des coûts plus élevés pour les clients.

De plus, la solution UiPath Document Understanding fournit la station de validation. Cet outil permet aux utilisateurs de revoir et, si nécessaire, de corriger la classification des documents et les résultats de l'extraction automatique des données.

Réflexions finales sur le choix d'une solution

Choisir une solution qui répond à tous les besoins de votre entreprise en matière de compréhension de documents peut représenter un défi de taille. Cela conduit généralement à évaluer les options de mise en œuvre simultanée de quelques solutions et à rechercher les meilleures façons de les intégrer. C'est pourquoi UiPath fonctionne et s'intègre avec un large éventail de fournisseurs leaders du secteur. Nous avons mis en place un riche écosystème de compréhension de documents qui complète la plate-forme UiPath RPA.

Pour des informations plus détaillées, rejoignez notre webinaire "Produit en vedette :automatisations améliorées par l'IA - Combinant des capacités de transformation". Vous verrez comment UiPath Document Understanding et d'autres solutions basées sur ML peuvent vous aider à porter vos automatisations à un tout autre niveau, alimentées par l'IA. Vous pouvez également tester ces fonctionnalités pour vous aider à automatiser vos processus métier en vous inscrivant à l'essai UiPath Enterprise.


Système de contrôle d'automatisation

  1. Comprendre le processus de fabrication d'arbres
  2. Comprendre l'importance de la culture cloud
  3. Comprendre les avantages de la maintenance prédictive
  4. Comprendre les bases de la fraiseuse
  5. Tirer parti de l'automatisation pour assurer la continuité des activités dans la nouvelle normalité
  6. Comment utiliser l'IA pour optimiser la compréhension des documents
  7. Commentaire :comprendre les méthodes de programmation des robots
  8. Comprendre la valeur de l'automatisation dans la fabrication
  9. Documenter les connaissances dans l'entreprise