Outil d'alerte pour la supervision du système d'information

📖 Définition ≪ Outil d'alerte pour la supervision du système d'information ≫: 

Un outil de supervision du système d’information permet de surveiller en temps réel le fonctionnement des applications et des systèmes critiques, en remontant des alertes quand certains événements se produisent.

Objectifs: 

- Détecter rapidement les problèmes
- Prévenir les incidents
- Surveiller le niveau de disponibilité du système d’information

Clés de succès: 

- Bien définir le périmètre à superviser
- Privilégier les solutions permettant de mettre en place des actions de remédiation automatisées

Guide: Outil d'alerte pour la supervision du système d'information: 

La surveillance du système d’information, ou monitoring, est indispensable pour prévenir les incidents et limiter l’impact si une panne survient. Elle nécessite la mise en place d’outils spécialisés. Il faut en effet pouvoir collecter en temps réel tous les événements générés par le matériel, les systèmes, les applications, les bases de données ou encore les équipements réseau, afin de pouvoir réagir rapidement en cas d’incident. Il existe de nombreuses solutions de monitoring, notamment en Open Source. Pour choisir, l’entreprise doit donc bien délimiter ses besoins.

Le premier critère concerne les environnements à superviser. Certaines solutions sont en effet spécialisées sur un type d’environnement ou de besoin, par exemple les réseaux, la sécurité, ou même le cloud public. Il faut donc commencer par délimiter le périmètre à superviser :
- Quels sont les équipements à surveiller ?
- Quels paramètres a-t-on besoin de surveiller ?
- L’entreprise travaille-t-elle avec des systèmes Unix, Windows, Linux ou autres ?

Ensuite, il faut regarder les fonctionnalités d’alerte proposées. Le volume d’information remontée dans les différents journaux (logs) des composants clefs du système d’information peut vite être conséquent. Beaucoup d’événements sont d’importance mineure, n’entraînant pas d’impact notable en matière de sécurité ou de performances. La solution de supervision doit donc être capable de trier et d’agréger les événements, afin de permettre aux administrateurs systèmes de pouvoir facilement identifier les plus importants.

Les questions suivantes permettent ensuite d’affiner le choix :
- Le niveau de filtrage proposé est-il satisfaisant ?
- Est-ce possible de l’ajuster en définissant des alertes personnalisées ?
- Est-ce facile de définir un processus d’alerte ?
- La solution permet-elle de gérer différents niveaux d’alerte, avec la possibilité d’escalader si nécessaire ?
- Quels types d’alertes sont possibles : notifications au sein de la solution, email, SMS, message instantané ?
- La solution fournit-elle des indicateurs globaux pour le suivi des performances et de la disponibilité, à travers des tableaux de bord ?
- Ces tableaux de bord sont-ils personnalisables, avec l’ajout d’indicateurs « maison » si besoin ?
- S’il s’agit d’une solution spécialisée, est-ce possible de remonter les alertes dans un outil plus généraliste ?

Enfin, pour améliorer la réactivité de l’entreprise face à certains incidents, il peut être intéressant de programmer des actions de remédiation automatiques. Toutes les solutions n’offrent pas les mêmes possibilités à ce niveau, cela peut donc être un critère de différentiation utile.