Fait ou fiction :quelle histoire vos données vous racontent-elles ?
En 30 000 av. J.-C., nos ancêtres ont peint des histoires sur les murs des grottes sur leur vie quotidienne, et en 700 av. J.-C., nous avions notre première histoire imprimée :Gilgamesh. Avancez jusqu'en 2021, et nous co-créons des histoires avec l'IA depuis plus d'une demi-décennie déjà. Mais lorsque l'ordre du jour est une intelligence économique précise, les entreprises veulent être assurées que leurs systèmes d'intelligence artificielle et d'apprentissage automatique ne prennent pas la liberté artistique et ne recrachent pas une histoire somptueuse.
Cela est particulièrement vrai maintenant que la prise de décision basée sur l'IA et le ML est à son plus haut niveau d'adoption à ce jour et même les dirigeants les plus réticents en viennent à voir les immenses avantages à tirer d'une approche stratégique centrée sur les données. Alors que la confiance se renforce dans la promesse de l'IA et du ML, la précision est essentielle. La question reste primordiale pour beaucoup :"Comment pouvons-nous savoir si nos données nous racontent toute l'histoire, et si elle est basée sur des faits ? Que devons-nous savoir pour faire confiance à nos modèles ?"
Des données impeccables
Lorsqu'un système d'apprentissage automatique propose une prédiction inexacte, nous pouvons nous tourner vers un seul coupable :les données. À l'exception des événements de cygne noir, les données sont le début, le milieu et la fin de tout système prédictif. Il se peut qu'il n'y ait tout simplement pas assez de données pour former le système de manière fiable ou sur lesquelles baser ses prévisions, auquel cas plus de points de données peuvent résoudre le problème. Habituellement, quelque chose comme ça serait pris dans les premières étapes de l'idéation sur un modèle et presque certainement avant le déploiement, du moins dans la mesure où il évite des prédictions extrêmement inexactes. Le coupable le plus probable, cependant, est que les données de départ n'étaient pas assez "propres". Assez propre est relatif. Les exigences en matière de données pour certains projets s'apparentent à « Mes baskets sont-elles assez propres pour aller au supermarché ? D'autres, en particulier dans les systèmes critiques et ceux qui impliquent la vie, la sécurité et le bien-être, ressemblent davantage à des scénarios "sans poussière, brillants et brillants dans lesquels vous pourriez vérifier vos dents" lorsqu'il s'agit de la propreté des données. pour effectuer la tâche de manière fiable (et éthique).
Alors, qu'est-ce qui rend les données sales ? L'histoire courte est une information inexacte ou biaisée.
Étiquettes cassées, modèles cassés
Il peut s'agir de données mal étiquetées, de données contenant les mauvaises informations dans le mauvais champ ou dans un format incorrect, par ex. 27 décembre 2015 au lieu du 27/12/15 ou 27/12/2015. Alors que la première option peut simplement générer une erreur ou être ignorée, l'échange des deux derniers formats de date peut avoir de graves répercussions sur la précision. Et les dates ne sont pas tout ce que le formatage non valide peut affecter :les heures, les SKU, le texte où les chiffres doivent être, les chiffres où le texte doit être et tous les flux de données spécialisés qui sortent de l'équipement de l'atelier comme les remplacements, les alarmes, les charges, les vitesses, flux, etc. Le fait est que sans une structure fiable et cohérente, les données peuvent devenir désordonnées et conduire à des informations inexactes.
Avec MachineMetrics, les entreprises peuvent tirer parti de notre moteur de transformation de données automatisé qui normalise et formate un large éventail de types de données pour une analyse facile. Il peut gérer les valeurs de capteur personnalisées, l'état de la machine, les modes, les alarmes, les dérogations, la charge, les vitesses, les alimentations, les paramètres PMC, les diagnostics, etc.
Pouvez-vous faire confiance à vos sources ?
Il est également important de tenir compte de la véracité et de l'exactitude de toutes les sources de données utilisées, surtout si ces sources sont humaines. Les humains ne sont pas les créatures les plus précises. Nous arrondissons, oublions et trafiquons les chiffres. Nous devenons paresseux ou fatigués ou affamés ou distraits. De par la nature de l'utilisation de sources de données humaines, les données seront sales d'une manière ou d'une autre. C'est ici qu'il est important de regarder les tolérances. Par exemple, les opérateurs de machines peuvent ajouter des données sur l'état de l'équipement qu'ils utilisent. Lorsque vous donnez des informations sur les temps d'arrêt, les raisons énumérées peuvent être exactes alors que le temps est plus une estimation. Cela conduit à un système prédictif moins précis, car les réponses qu'il produit sont également plus proches des estimations qu'elles ne l'auraient été si elles avaient fourni des données vraiment précises.
Il s'agit d'un autre scénario où des tolérances réalistes doivent être envisagées. Intervalles de secondes ou d'une demi-heure ? Dans le cas de l'approvisionnement en données machine, vous pourriez même envisager des nanosecondes ou moins pour certains cas d'utilisation. Quelle que soit la tolérance jugée raisonnable pour le projet, il est important de faire respecter cette tolérance et de s'assurer que toutes les données entrées dans le système correspondent à ces paramètres de précision.
L'adaptateur de données haute fréquence de MachineMetrics capture les données de la machine à 1 kHz (par rapport à un standard de 1 Hz, donc 1 000 x plus rapide) pour que vous ne manquiez jamais un battement, quel que soit le niveau de précision requis par votre application.
C'est également là que les entreprises devraient également rechercher le potentiel de biais. Les mensonges par omission conduisent toujours à des prédictions de conte de fées. Vos sources de données collectent-elles suffisamment largement pour montrer l'ensemble du tableau ou sont-elles sujettes à des biais en raison des méthodes de collecte utilisées ? Par exemple, si vous essayez de déterminer le salaire moyen d'un ouvrier à la chaîne de production, mais que tous les répondants étaient des hommes, vous obtiendrez probablement un chiffre biaisé par rapport à si vous interrogez les hommes et les femmes pour obtenir une idée plus claire et plus claire. image plus précise. La recherche active d'omissions potentielles comme celle-ci peut conduire à des données plus propres et à des prévisions plus précises.
Contexte et complexité
Plus un système est complexe, plus il y a de place pour les inexactitudes, les incohérences, les risques et les pannes générales dans les données et la logique qui le sous-tendent lorsque vous essayez de le traduire en quelque chose qui peut être utilisé pour l'analyse. Combien d'étapes y a-t-il dans le processus sur lequel vous essayez de collecter des données ? Avez-vous les connaissances de l'industrie pour vous aider à donner un contexte aux données brutes ? Par exemple, une machine qui "s'arrête" plusieurs fois en quelques minutes avec une production réussie entre les deux est moins susceptible d'être de véritables cycles de production, mais indique plutôt des tests pour s'assurer que le problème initialement causé par le temps d'arrêt est entièrement résolu, recalibré et prêt à reprendre réel production. Cependant, laisser ces chiffres dans l'ensemble de données tels qu'ils ont été saisis pourrait entraîner de graves inexactitudes qui pourraient être difficiles à saisir pour un œil non averti.
Cela ne signifie pas que votre équipe de science des données doit être l'expert ultime dans tout ce qui concerne votre secteur. Cela signifie cependant que le fait d'avoir des canaux où les experts peuvent ajouter du contexte est essentiel. Par exemple, avec MachineMetrics, les opérateurs de machines sont équipés d'une tablette dans l'atelier, directement sur leurs machines. Ils peuvent rapidement et facilement ajouter un contexte humain aux données numériques afin d'améliorer la précision au stade de l'analyse. Sans ce type de canal contextuel, cela peut devenir un jeu de devinettes pour déterminer quels numéros doivent être jetés dans le pot et lesquels doivent être jetés.
Transformations sans perte
Lorsque vous transformez une chose en une autre chose, il y a fondamentalement toujours un certain degré de perte, aussi minime soit-elle - qu'il s'agisse de transformer du minerai en acier, du coton en textile ou des données dans un format d'analyse, il est important de déterminer combien de perte est acceptable et comment beaucoup est évitable. Commencer par des données propres et précises est une première étape essentielle dans une analyse propre et précise. Au-delà de cette étape, il est nécessaire de considérer quels outils vous utiliserez et pour quelles applications, la probabilité d'une éventuelle perte de fidélité, et dans quelle mesure cela est acceptable (ou non pertinent). Cela nous ramène directement à la compréhension de ce que vous essayez de faire avec vos données et avec vos modèles (quels problèmes vous essayez de résoudre) et le niveau de précision requis pour les résoudre efficacement.
Chez MachineMetrics, nous nous assurons que vos données vous donnent toute la vérité et rien que ça. Nous sommes des experts de l'industrie qui comprennent la profondeur, l'étendue et le type de données dont vous avez besoin pour résoudre vos problèmes les plus urgents, qu'il s'agisse de temps d'arrêt de la machine, d'optimisation de la production ou d'une myriade d'autres options, en utilisant une approche basée sur les données. Nous utilisons des formats simples et digestes de partage et d'analyse qui conservent leur intégrité et leur fidélité, même en temps réel. MachineMetrics simplifie la tâche d'intégration des données d'atelier avec la prise de décision dans le monde réel grâce à un processus éprouvé, mis en œuvre en langage clair et avec des outils si simples que même les personnes non techniques peuvent facilement les installer, pour un service qui a conduit nos clients à un retour sur investissement en moins d'une semaine. Pour voir à quels types de questions MachineMetrics peut répondre pour votre entreprise ou pour réserver une démonstration, contactez-nous à tout moment ici.
Technologie industrielle
- Détecter ou ne pas détecter :les avantages de l'IIoT pour votre usine
- Lubrification des équipements de fabrication :réalité contre fiction
- De quels blocs de construction IoT avez-vous besoin pour votre projet ?
- Cervoz :protégez vos données contre les coupures de courant soudaines
- Utiliser vos données
- Savez-vous ce que vaut votre entreprise ?
- ActiveCare Direct ou CareTrack – Lequel convient le mieux à la gestion de votre flotte ?
- 10 raisons pour lesquelles vous devriez inclure un système d'acquisition de données dans votre entreprise
- Êtes-vous prêt pour une Smart Factory ?