Automatisez tout ou laissez-vous distancer
DevOps consiste à accélérer la livraison de nouveaux produits et services à grande échelle, de manière fiable et abordable. Cela nécessite une automatisation, c'est-à-dire l'utilisation de logiciels pour créer, configurer, déployer, mettre à l'échelle, mettre à jour et gérer d'autres logiciels.
Nous pensons généralement que la surveillance se produit parallèlement à ce processus - son travail consiste à alerter les opérateurs lorsque les choses tournent mal, à aider à analyser les problèmes, à confirmer la conformité aux objectifs de niveau de service. Mais il est préférable de traiter la surveillance comme un élément essentiel de l'automatisation des opérations. Une plate-forme de surveillance moderne et complète peut être un puissant moteur d'automatisation à part entière et un catalyseur essentiel pour des initiatives d'automatisation plus importantes dans la gestion du cycle de vie des applications et de l'infrastructure et l'atténuation des problèmes. Il peut même, dans de nombreux cas, permettre des opérations autonomes telles que l'auto-scaling et l'auto-rétablissement.
>Voir aussi : Surveillance informatique :Ne vous surveillez pas dans une maison de fous, Opsview
Voici quelques-unes des façons dont votre système de surveillance peut vous aider à en faire plus, à éliminer les erreurs humaines et à respecter (et pas seulement à respecter) les objectifs de niveau de service :
Déploiement et gestion du cycle de vie simplifiés et automatisés du système de surveillance. Les solutions de surveillance sur site peuvent cohabiter avec l'infrastructure surveillée ; aussi bien dans les clouds privés classiques et les centres de données que dans les clouds privés virtuels (VPC) hébergés par des fournisseurs. Cela leur permet de se conformer à la sécurité, à la confidentialité, à la gouvernance des données et à d'autres réglementations ; et les aide à surmonter les barrières de bande passante et de coût qui peuvent limiter l'évolutivité des solutions de surveillance SaaS. Cependant, la surveillance des locaux doit être déployée, mise à l'échelle et mise à jour, ce qui peut être décourageant pour toutes les configurations, sauf très simples, à serveur unique.
Les fabricants tournés vers l'avenir de ce type de plate-forme de surveillance commencent à exploiter des frameworks d'automatisation de déploiement populaires tels qu'Ansible, Puppet et Chef (les mêmes que DevOps utilise pour automatiser le déploiement de l'infrastructure et les opérations de routine) pour rationaliser le déploiement du système de surveillance dans les environnements scale-out. , configurations hautement disponibles. Pour la commodité des opérateurs, ils cachent la complexité des outils de déploiement derrière des interfaces utilisateur Web et des configurateurs simplifiés, bien que les outils standard soient accessibles aux personnes DevOps qui souhaitent harmoniser le déploiement du système de surveillance ou du collecteur de métriques avec les déploiements d'infrastructure - une meilleure pratique. Les détails de la surveillance peuvent être définis et conservés dans le cadre de référentiels définitifs "d'infrastructure en tant que code".
>Voir également : La valeur de la visibilité dans votre centre de données
Déploiement automatisé de l'agent et enregistrement des objets surveillés via l'API. Les outils de déploiement standard comme Ansible peuvent également être utilisés pour injecter, configurer et mettre à jour les composants de surveillance (agents de point de terminaison, bibliothèques requises, etc.) sur les hôtes. Les mêmes outils peuvent extraire des faits des manifestes de déploiement ou directement des hôtes au moment du déploiement, puis utiliser les API du système de surveillance pour configurer rapidement la surveillance de l'infrastructure et des applications hôtes, ainsi que les hôtes « non surveillés » en fin de vie. La surveillance systématique des systèmes dès leur déploiement permet une détection rapide des problèmes de préproduction ou de production, et peut être utilisée pour déclencher des restaurations, si nécessaire, ce qui constitue une bonne pratique importante pour une livraison continue.
Ingestion CMDB. Certaines plates-formes de surveillance peuvent ingérer des données à partir d'outils de gestion des opérations et de bases de données de gestion de configuration (CMDB), telles que celles proposées par ServiceNow et des fournisseurs similaires. Cela permet aux opérateurs de configurer rapidement et en toute confiance la surveillance de l'infrastructure existante, des applications et des services commerciaux complets, évitant ainsi la compilation manuelle laborieuse et sujette aux erreurs des faits système.
>Voir également : Quel est le bon logiciel de stockage nécessaire pour que DevOps soit un succès ?
Découverte et surveillance automatique. Les solutions de surveillance sophistiquées utilisent une gamme croissante de méthodes, y compris l'accès direct aux hôtes via SSH et l'accès indirect via des référentiels de configuration comme ActiveDirectory et des services comme Windows Discovery, pour extraire des faits de l'infrastructure existante et accélérer la configuration de la surveillance par les opérateurs. Les produits de pointe s'orientent désormais vers l'automatisation complète du processus :en créant des cartes complètes de l'infrastructure, des applications et des services commerciaux complets et en surveillant ces éléments sans nécessiter d'intervention ou de direction manuelle.
Traitement des alertes, notification, escalade, intégration. L'alerte est, bien sûr, une puissante forme d'automatisation. Cela implique une prise de décision, qui peut être simple (par exemple, une métrique a dépassé un seuil donné) ou beaucoup plus complexe (par exemple, plusieurs métriques, provenant de systèmes distincts, sont entrées dans des états prédictifs d'un type particulier de défaillance connue pour une entreprise critique service). Cela implique une affectation et une escalade sophistiquées basées sur le problème, les rotations d'équipe, l'heure / la date et d'autres variables. Il exige une intégration sortante avec des méthodes de communication telles que le courrier électronique ou avec des plates-formes de notification multimodes telles que PagerDuty ; ou une intégration plus sophistiquée avec la gestion des problèmes (par exemple, JIRA) ou la gestion des flux de travail des opérations (par exemple, ServiceNow) ainsi que la collaboration (par exemple, Slack) et d'autres solutions. Toute cette puissance d'automatisation fonctionne ensemble pour envoyer la bonne alerte à la bonne personne au bon moment tout en évitant les alertes excessives et la fatigue, ce qui facilite les opérations et aide les équipes à éviter les temps d'arrêt et à respecter les engagements SLO.
>Voir également : Comment l'automatisation de la charge de travail peut accélérer DevOps
Atténuation proactive des problèmes. Enfin, des solutions de surveillance sophistiquées offrent désormais la possibilité d'exécuter des scripts sur des hôtes ou de déclencher une automatisation centralisée (par exemple, Ansible) pour effectuer des tâches basées sur des conditions surveillées :du redémarrage d'un serveur défaillant à la mise à l'échelle d'un cluster d'infrastructure. Au cours de la prochaine décennie, les développements de l'apprentissage automatique amélioreront progressivement la capacité de surveiller les systèmes pour en déduire la structure et la fonction abstraites des services métier, les surveiller automatiquement, prédire leurs modes de défaillance, les réparer et optimiser leurs performances - soit de manière autonome, soit par des moyens optimaux. allocation des ressources de l'opérateur aux tâches.
Par John Jainschigg, responsable de la stratégie de contenu chez Opsview
Système de contrôle d'automatisation
- Comment obtenir une formation certifiée PROFIBUS ou PROFINET à distance…
- Automatiser... ou Sinon
- Collaborative Robot Marketplace ajoute un logiciel de surveillance
- B&R présentera sa solution de maintenance conditionnelle à Agritechnica
- Hahn présente un « large éventail » de solutions d'automatisation à Automate
- 9 applications pour automatiser les processus de votre entreprise
- Webinaire :Automatisez votre processus avec Techman Robot
- Le rôle des IHM dans la surveillance de l'énergie
- Les robots obtiennent la coordination œil-main