Revenir à ce que vous aimez des données :résoudre les problèmes courants liés à la science des données avec AI Fabric
Note de l'éditeur : Alors que le marché de l'automatisation continue d'évoluer, la plate-forme UiPath se met également à jour pour répondre au mieux aux besoins d'automatisation de nos clients. En tant que tels, certains des noms de produits de cet article ont évolué depuis la publication initiale de l'article. Pour des informations à jour, veuillez visitez notre page AI Center .
J'adore travailler avec les données. Mais cela me cause-t-il une certaine frustration? Vous pariez.
Ayant travaillé comme scientifique des données pendant plus de cinq ans, j'ai ressenti la douleur d'essayer d'équilibrer mes ambitions pour les données avec les limites qui surviennent lors de l'opérationnalisation des données. Par exemple, j'ai quitté un poste dans une entreprise que j'aimais parce que nous n'avions pas les ressources nécessaires pour mettre en production un modèle d'apprentissage automatique (ML). Nous avons travaillé très dur pour résoudre des tâches en utilisant des données et nous n'avons finalement pas eu l'opportunité d'avoir un impact sur le produit. Lorsque votre travail s'enlise dans des défis organisationnels et opérationnels, il peut être facile de se décourager et de perdre de vue pourquoi vous avez aimé travailler avec des données en premier lieu.
Dans ce blog, j'aimerais parler du parcours d'un data scientist :
-
Ce qui motive notre intérêt pour le monde des données
-
Les limites auxquelles nous sommes confrontés lorsque les attentes rencontrent les réalités
-
Les possibilités dont nous disposons pour changer la façon dont nous opérationnalisons les données en intégrant mieux la science des données dans des technologies telles que l'automatisation robotique des processus (RPA)
-
Pourquoi je suis enthousiasmé par AI Fabric, une solution qui intègre l'intelligence artificielle (IA) à la RPA, pour créer de nouvelles opportunités de tirer le meilleur parti des données
Par amour des données, j'aime être un résolveur de problèmes créatif, et les données permettent une résolution créative des problèmes.
Utiliser les données pour s'attaquer à des tâches difficiles et résoudre des défis qui ont un impact sur la vie des gens me semblait être un cheminement de carrière naturel. De nombreux scientifiques des données avec lesquels j'ai travaillé sont allés sur le terrain pour apprendre à utiliser les données pour résoudre des problèmes. Nous sommes passionnés par la compréhension des données dont nous disposons, l'exploration, le développement et l'utilisation d'algorithmes de ML pour tester nos données, puis la recherche de moyens de concrétiser de nouvelles solutions grâce à la puissance et aux informations que nous générons avec les modèles que nous construisons.
Lorsque j'ai décidé de devenir data scientist, je savais qu'il y avait des tâches et des maux de tête possibles qui accompagnaient le travail. Quel que soit le type de données avec lesquelles vous travaillez, vous allez inévitablement :
-
Passez du temps à traiter et à nettoyer vos données
-
Attendez un moment que vos modèles s'entraînent
-
Passez du temps à essayer différents hyperparamètres
Plus je travaillais avec des données, plus je devenais conscient de la complexité de la science des données dans les limites d'une organisation. Les réalités associées au métier de scientifique des données ont commencé à éclipser mes motivations initiales pour entrer dans le domaine.
Quand la réalité frappe :définir les attentes et gérer les données de bout en bout
De nombreuses entreprises adoptent une approche de développement axée sur les données et en sont aux premières étapes de l'exploration du ML. Le rôle du data scientist est encore assez rare, et dans de nombreux cas, mal compris. Différents défis peuvent survenir pour les scientifiques des données lorsque nous commençons à opérationnaliser les données au sein d'une entreprise et progressons en utilisant les données pour résoudre des problèmes.
Définir des attentes sur ce qu'une organisation peut (et ne peut pas) faire avec le ML est un domaine dans lequel nous passons beaucoup de temps. Il est important d'éduquer les autres sur la nature de nos rôles en tant que data scientists, sur quoi nous souhaitons concentrer notre temps et sur ce dont nous avons besoin pour que nos projets réussissent.
Un autre défi est le fait que les opérations de science des données sont souvent cloisonnées au sein des organisations. Cela peut limiter la capacité des projets de science des données à apporter de la valeur à une organisation.
Les modèles de ML seuls ne peuvent rien faire et ne font rien :ils doivent travailler en collaboration avec d'autres équipes et être inclus dans le cadre d'un projet plus vaste pour réussir.
De plus, il est souvent très difficile de montrer le retour sur investissement (ROI) induit par les modèles. Les scientifiques des données sont souvent confrontés à une bataille difficile pour défendre le rôle du ML au sein d'une organisation. Les scientifiques des données peuvent faire tourner de nombreux cycles pour justifier le rôle que nous cherchons à jouer et ce dont nous avons besoin pour avoir un impact.
S'attaquer aux données elles-mêmes apporte son propre ensemble de défis uniques. Nous passons souvent plus de temps à collecter, consolider et nettoyer des ensembles de données, plutôt que de travailler à comprendre les données et à créer des modèles. À moins qu'un pipeline d'intégration continue et de livraison continue (CI/CD) pour vos modèles ne soit déjà construit au sein d'une entreprise, une grande partie de notre temps est consacrée à la création d'un pipeline évolutif pour faire passer votre modèle de votre machine locale à la mise en scène et à la production. Non seulement cela ne fait pas partie de notre champ d'activité, mais cela nous prend du temps que nous souhaitons consacrer à la construction et aux tests de modèles.
La surveillance continue des modèles peut également être un défi auquel vous n'êtes pas préparé. Expérimentons-nous une dérive des données dans le temps ? Les données en production sont-elles toujours les mêmes que les données que nous avons utilisées pour la formation ? Les sorties sont-elles toujours sous contrôle ? Avec de nouvelles données, notre modèle fonctionne-t-il aussi bien que le modèle de base, qui a été construit avec l'ensemble d'apprentissage ? Quand devez-vous mettre à jour le modèle de ML ?
Pour en revenir à ce que j'aime, j'ai cherché des opportunités de travailler pour des entreprises qui accordent la priorité à l'intégration de la science des données dans des processus et une planification plus larges. Aujourd'hui, je suis ravi de travailler pour une entreprise qui non seulement donne la priorité à la science des données en interne, mais qui travaille activement pour aider les entreprises à opérationnaliser et à utiliser des modèles de ML afin d'obtenir de meilleurs résultats commerciaux.
Revenir à ce que vous aimez avec AI Fabric
Alors que de plus en plus d'organisations utilisent la RPA pour rationaliser les processus, les spécialistes des données ont la possibilité d'opérationnaliser les données de nouvelles manières.
Chez UiPath, nous nous engageons à réunir la science des données et la RPA et à donner aux entreprises les moyens d'obtenir de nouveaux résultats grâce à l'automatisation intelligente. En associant la science des données à la RPA, nous souhaitons atténuer bon nombre des défis susmentionnés auxquels les scientifiques des données sont confrontés au quotidien dans le monde de l'automatisation. Nous menons ces efforts avec AI Fabric.
Lire connexe : Comment Heritage Bank utilise l'IA et AI Fabric
Nous pensons que la science des données et la RPA sont meilleures lorsqu'elles fonctionnent ensemble. Il est essentiel de faire de la science des données une partie intégrante d'un centre d'excellence (CoE) RPA en faisant appel à des scientifiques des données pour décrire ce qui est possible lors de l'utilisation des données et du ML pour améliorer les capacités RPA.
Grâce au développement d'AI Fabric, nous nous efforçons d'aider les organisations à considérer le ML comme une étape du processus d'automatisation. Nous voulons aider les utilisateurs à intégrer le ML au développement RPA de manière plus transparente. En utilisant AI Fabric et RPA, les data scientists peuvent simplifier la construction de pipelines de données avec des outils qui se concentrent sur le prétraitement et la collecte de données. Ils peuvent facilement déployer des modèles, surveiller des modèles et adopter un flux de travail RPA conçu pour faire travailler ensemble les humains et les modèles de ML.
En intégrant la science des données à la RPA, nous souhaitons aider les scientifiques des données à prouver le retour sur investissement des modèles créés et déployés, et à consacrer la majeure partie de leur temps à l'exploration des données et à l'amélioration des modèles qui résolvent les problèmes du monde réel.
Que feriez-vous si vous aviez plus de liberté pour vous concentrer sur vos données ?
Je sais par expérience personnelle que donner aux scientifiques des données les moyens de se concentrer sur la résolution de problèmes à l'aide de données et d'intégrer la science des données dans les processus existants peut changer la façon dont une organisation évolue et se développe.
Ce qui compte le plus pour moi, c'est d'aider les clients à obtenir de meilleurs résultats. Dans mon rôle chez UiPath, j'ai vu de mes propres yeux comment les entreprises peuvent automatiser des processus plus complexes en intégrant la science des données à la RPA. Il est gratifiant de voir les scientifiques des données se libérer des défis courants d'opérationnalisation des données alors que les entreprises intègrent la science des données dans les déploiements RPA grâce à des produits comme AI Fabric.
Apprenez-en plus sur AI Fabric ou inscrivez-vous à notre programme Insider Preview pour accéder en avant-première aux nouvelles offres d'AI Fabric.
Système de contrôle d'automatisation
- 5 types courants de poignées en T :ce que vous devez savoir
- Que dois-je faire avec les données ? !
- 12 applications de science des données les plus courantes en 2021
- Acheté une maison avec fournaise au mazout ? Ce que vous devez savoir sur la livraison de pétrole
- Vous songez à vous lancer dans l'outillage en direct ? Voici ce que vous devez savoir
- Jumeaux numériques :qu'entendez-vous par là ?
- Premiers pas avec le groupe Eagle :ce que vous devez savoir
- Ce que vous devez savoir sur le financement d'équipement
- Se connecter