Base de connaissances / Knowledge base

Dispositif Zalertor - surveillance de votre parc informatique - présentation détaillée du dispositif
Présentation du concept Zalertor, avec options SysCo-InHouse et StandAlone.

Zalertor désigne un ensemble de dispositifs logiciels et matériels permettant de surveiller des services offerts par des ordinateurs (workstation ou serveur) connectés à l'Internet (par exemple : services, processus, CPU, disques durs, température, connexion, ping, etc).



Dans le cas où l'un des services surveillés est défaillant, Zalertor avertit par SMS et/ou courriel que le service est défaillant, afin que des actions soient prises pour remettre le service en disponibilité.


Élements

Zalertor se compose de plusieurs éléments:

  • Un serveur central qui va surveiller les autres machines. Sur cette machine, un logiciel de surveillance tourne continuellement.
  • Le composant Zalertor proprement dit est installé sur ce même serveur.
  • Il est possible pour Zalertor d'envoyer les SMS en passant par un service d'envoi de SMS sur Internet.
  • Ce même service peut être utilisé également dans l'autre sens: réception de SMS puis transmission d'un mail vers Zalertor pour quittancer une alerte.
  • Relié à la machine, un téléphone mobile peut servir à envoyer les SMS, directement sur le réseau GSM. (Ceci est facultatif et demande un développement particulier)

Note

Certaines alertes n'ont pas besoin qu'un logiciel spécifique tourne en plus sur la machine à surveiller. Par exemple, la surveillance d'un serveur web se fait simplement en regardant si le port 80 de la machine répond. Pour d'autres alertes, telle que le dépassement du seuil de tolérance de l'espace disque libre, il faut un logiciel simple à faire tourner tout le temps dans la machine à surveiller. Ce logiciel communiquera directement avec le serveur.

Principe

Imaginons que nous surveillons le service FTP de la machine www.notresite.com. Voici le cursus:
  1. Le logiciel de surveillance se rend compte que le port 21 de la machine cible n'est plus accessible.
  2. Il marque alors dans ses registres que le service ftp de la machine est en panne.
  3. Il envoie cette information dans la base de donnée de Zalertor via un script (la passer de 'vert' à 'rouge').
  4. Si nous avons dépassé la limite des erreurs successives avant avertissement, Zalertor va envoyer un mail et/ou un SMS à qui de droit et à intervalles réguliers (Entre 5 min et 30j en 11 paliers). Sinon, il va attendre d'avoir atteint cette limite.
  5. La personne qui reçoit le mail et/ou le SMS peut immédiatement se mettre au travail afin de remettre le service ftp en ligne sur la machine.
  6. Éventuellement, en répondant au mail ou en répondant au SMS avec son téléphone mobile, la personne peut désactiver l'alerte, signifiant ainsi qu'elle y travaille. L'alerte correspondante, bien que toujours actuelle, n'enverra alors plus de mails et/ou SMS, et ce jusqu'à la prochaine panne
Notons encore une possibilité de gel total : avec un simple SMS on peut geler toutes les alertes pour un nombre définit (dans les préférences) de minutes. Une fois fait, et pour ce laps de temps, plus aucun mail/SMS ne sera envoyé quelque soit le nombre d'alertes.

Précisions
- Une alerte signifie "un problème spécifique sur une machine spécifique". Le service web de www.notresite.com est une alerte, le service ftp de www.notresite.com en est une autre.

- Pour chaque alerte, on peut définir si l'on doit envoyer un mail, un SMS, les deux ou rien du tout. Pour les envoi de SMS, on peut définir une fourchette horaire (Ex: 8h-20h) afin de ne pas être réveillé de nuit par une alerte de moindre importance.

- Pour chaque alerte, on peut soit donner une adresse mail (resp. un numéro de téléphone mobile) spécifique, soit lui faire utiliser l'adresse (ou les adresses) et le numéro (ou les numéros) de téléphone configurés par défaut dans les préférences de Zalertor. Il est optionnellement possible de faire envoyer les mails et/ou SMS aux destinataires par défaut en plus des destinataires spécifiques.

- Chaque alerte comporte deux niveaux : un niveau 'rouge' correspondant à la panne du service et un niveau 'pourpre' correspondant à l'impossibilité de vérification de l'état du service. On peut par exemple décider pour une alerte de n'être averti que par mail des alertes pourpres, et par mail et SMS pour les alertes rouges.

- Pour chaque alerte, on peut configurer un nombre de fois consécutives où le service doit être en panne avant de lancer les avertissements (Par tranches de 5min, donc 4x => avertissement au bout de 20min de panne). Cela peut par exemple être utile lorsque des services peuvent parfois, pour peu de temps, être indisponibles ou considérés comme tel (une surcharge CPU pour un backup quotidien, par exemple). Un nombre par défaut est également dans les préférences.

- Dans les préférences globales, on peut mettre une adresse email de Cc, qui recevra copie de toutes les alertes mails envoyées, que ce soit à l'adresse par défaut ou aux adresses spécifiques par alerte.

- Normalement, chaque alerte est relevée toutes les 5 minutes. Si elle n'est toujours pas revenue au vert, le mail et/ou SMS part (pour autant que cette alerte soit configurée pour l'envoi de mail et/ou SMS). Pour les alertes de gravité moindre, par exemple le ping sur une machine peu importante, on peut choisir de ne faire ce relevé d'état que toutes les 10min, 15min, 20min, 30min, 45min, 1h, 2h, 6h, 12h, 24h, 7j ou 30j; ceci permet de ne pas être innondé de mail/SMS toutes les 5 minutes pour un problème peu important. Et ceci individuellement pour chaque alerte; la valeur par défaut étant de 5min. Une alerte ayant un délai plus grand que 5min et une fourchette horaire d'envoi SMS enverra un mail et/ou un SMS durant la période contenue dans la fourchette horaire et ce même si le précédent envoi a été fait il y a moins de (24h, 12h, 6h, etc).

- Différentes listes permettent rapidement de voir, par exemple, toutes les alertes n'envoyant pas de mail ni SMS.

- Lorsqu'une alerte qui n'est pas encore dans la base de données de Zalertor passe au rouge ou au pourpre, elle est insérée par Hobbit automatiquement dans la base de données Zalertor.

- Certains types d'alertes (pop3, smtp, etc) peuvent être configurés via les préférences pour être insérées directement avec envoi de mail à une adresse par défaut. Les autres alertes ajoutée automatiquement n'envoient par défaut ni mail ni SMS. Dans les deux cas, un mail est envoyé aux administrateur lors d'un tel ajout, afin de leur signaler la nouvelle alerte et de leur laisser la possibilité de la configurer immédiatement pour l'envoi de mail et/ou SMS (L'URL de la fiche de la nouvelle alerte est dans le mail). De même, on peut définir, par type d'alerte, le délai entre deux mail/SMS par défaut (appliqué aux alertes au moment de leur création). La valeur peut ensuite être modifiée pour chaque alerte.

- Le dispositif peut rapporter les alertes les plus urgentes d'une façon alternative. Plutôt que d'envoyer un mail par alerte toutes les 5 minutes, il peut envoyer un seul mail global pour signaler les alertes importantes courantes. Ces mêmes alertes sont disponibles seules, dans une liste de façon à avoir rapidement une vue sur toutes les alertes importantes. Dans les préférences, on peut sélectionner les types d'alertes à considérer comme importantes et on peut mettre la ou les adresses email où le mail doit partir. Chez SysCo, ces mails partent deux fois par jour à la permanence technique qui peut aussi, en tout temps, consulter la liste précitée.

- La liste des alertes, courantes ou non, peut aussi être visualisée triée par destinataire. On peut ainsi savoir facilement quelles alertes rouges et quelles alertes pourpres sont envoyées à telle adresse email ou à tel numéro de téléphone mobile.


Qui surveille le surveillant?
Il pourrait naturellement arriver que ce soit la machine sur laquelle tourne Zalertor qui aie un problème de connexion. Si cette machine, avant d'envoyer des mails, se rend compte qu'elle ne peut pas accéder à l'internet, elle est capable d'envoyer un SMS à (aux) administrateur(s) afin de les avertir que Zalertor ne peut momentanément rien surveiller. De même, avant d'envoyer un SMS, le système s'assure que le service SMS par internet est opérationel. Sinon, il ne passera que certains SMS mais par une passerelle indépendante de la connexion internet.

De plus, une autre machine -sur le même réseau local- regarde régulièrement si la machine sur laquelle tourne Zalertor est toujours présente et si le service hobbit y tourne bien. Elle peut envoyer des mails et/ou des SMS si cela n'est pas le cas (en heures de jour). Enfin, une troisième machine, distante, regarde régulièrement si le réseau sur lequel se trouve la machine Zalertor et la machine Zalertor elle-même est bien disponible. Dans le cas contraire, elle envoie un SMS aux administrateurs si on est dans des heures de jour.

SysCo InHouse
On utilise ici les serveurs du logiciel de surveillance et Zalertor en production de SysCo, avec facturation des SMS et configuration on-demand.

StandAlone
Le service complet est installé sur des machines du client.