Supervision / Monitoring entre chatons

On en parle pas souvent mais ils sont souvent là lors des rassemblements sur les logiciels libres: les gars de Centreon (cocorico) font un super boulot aussi. Pour l’avoir utilisé pendant 2 ans en entreprise après une courte expérience Zabbix : en monitoring ‹ traditionnel ›, type Nagios, c’est solide et ca fait le boulot sans qu’on ai grand chose à pouvoir lui reprocher. J’ai aussi trouvé le passage à Centreon depuis Nagios beaucoup plus ‹ naturel › que Zabbix (bien que, une fois qu’on a compris le paradigme de Zabbix, cela se pilote pas mal non plus).

+100
Tu as raison, je les vois sur chaque salon, et au niveau boulot on prends des trucs style prtg, pas foutu de monter un centreon …

Il y avait cette idée ici aussi https://talk.libreho.st/t/new-generation-status-page/112

Mais je vois bien que le problème est que chacun utilise son stack de monitoring, et a part discuter technos, on avance pas trop :slight_smile: (J’adore aussi ça, c’est la principale raison de mon implication dans chatons je pense :slight_smile: et je vois que le forum technique fonctionne super bien!)

Nous aussi on a besoin du service et on peut aussi l’offrir a d’autres chatons.

Plus je me rapproche du moment ou je compte me joindre au collectif plus je me dis qu’il est impératif (je pense) que nous ayons un site qui présente une carte des chatons avec l’état de chacuns de nos services.
J’ai entendu parlé de celui de framasoft mais c’est un état mise à jour manuellement par les admin. sys … donc pas vraiment tip top.
De plus c’est quand même la meilleure solution pour connaitre l’état des services de son chatons, même à titre individuel, à moins d’avoir un compte chez Grafana ou autre pour tester les services qui sont down ou up.

Il faudrait pouvoir monter cet outil réparti (la base dupliquée d’état et / ou d’incidents) sur tout les chatons, tout le monde dispose de l’info à l’instant t et ce sur l’ensemble de la grille de services que nous proposons tous.

Avant de mettre en place un site sur l’état des services, encore faudrait il savoir ce qu’on attend d’un CHATONS.
De mon petit point de vue de mec qui vient plus au réunion et qui suit l’actualité en dents de scie :

  • Un CHATONS n’est pas forcément ouvert à tous
  • Un CHATONS peut proposer plusieurs services ou un seul
  • Un CHATONS peut ouvrir ou supprimer un service comme bon lui semble

Heu c’est pas une critique hein ! (attention @pyg je te vois venir à 2 bornes), c’est un état de fait, et c’est tout à fait respectable.
Mais partant de ce principe, il est difficile de faire un « classement » ou même un « état » des services…

Le mieux reste ce qu’a proposé Framasoft : Pour chaque service, une page indiquant chez quel CHATONS aller…

cela n’empêche pas que chaque CHATONS ait les services que bon lui semble.
ce serait du style que l’on est un format ouvert d’échange de l’état de nos services (ou du service) que nous proposons, le tout mis dans une base répliquée entre tous (avec une fréquence qui reste à définir).
On aurait donc un monitoring (pas au sens Grafana, Zabbix, Centreon ,Ngios etc hein : du bcp plus light , un ping, un test du service et hop mais automatisé ) entre nous, sans histoire de classement.
Et si je ferme le service mail de ilinux, hop il disparaît de la base des services à monitoré.

Après je considère l’hébergement CHATONS comme un service ( à but non lucratif pour ma part mais rien n’empêche ceux qui souhaitent d’en vivre) qui se doit d’être transparent donc franchement si j’ai des pannes hardware, logiciels , attaques , des indispo : ben je le dits et l’écris, je n’ai aucun souci avec ça.

Ça se trouve cela existe déjà … mais voilà l’idée que je m’en fait : car comment faire en auto-hébergé pour se monitoré tout seul , il faut absolument avoir le test en dehors de l’infra pour tester … l’infra ?

1 « J'aime »

On frise le hors sujet :slight_smile:https://forum.chatons.org/t/mesure-qualite-de-service-chatons/551

je teste zabbix en mode web scénario (agentless donc : hors de question d’ouvrir quoi que ce soit pour un simple http GET ou telnet ip 25 )depuis,2 mois.
c’est hyper limité ( https marche pas) les données de temps de réponse sont fausses. les coupures pas détectées : si on regarde les 15 sites que je monitore … c’est parfait ok ok … sauf que j’ai eu 2 ou 3 coupures, c’est obligé. je l’ai reporté dans mon journal d’incidents manuels.

je teste aussi grafana : c’est beau mais faut payer, api key a tout les étages. Le WorldPing ? ben les données partent chez eux : génial pour un chatons.

je vais essayer netdata, et si c’est pas encore ça revenir à l’outil sur lequel je développé des plugins : Cacti…
Retour à la source, les fondamentaux comme d’hab.

Je monitore du HTTP et HTTPS sur différents services avec des règles précises (code de retour, contenu) et ça marche vraiment très bien chez moi.

oui mais en interne … ? !
Car j’avais mis Zabbix sur un serveur en Russie … lol.
Et obligé de prendre les scénario Web , j’allais pas foutre un agent zabbix sur mes serveurs de mon infra … et ouvrir la porte pour venir de russie vers mon infra … je suis pas suicidaire à ce point , lol.
A moins que tu es une autre recette.

Je monitore également des services hébergés chez Gandi. C’est tellement efficace que quand le cache applicatif des services est en train d’être regénéré, je reçois des alertes. J’ai aussi des alertes quand ces sites sont HS lors du processus de renouvellement de certificats (< 1 minute). Bref, ça marche.

netdata c’est bien , c’est joli, mais ça bouffe pas mal les ressources

tu utilises l’agent Zabbix ?

Oui mais les scénarios web ne s’appuient pas sur les agents zabbix car tout se fait depuis le serveur Zabbix.

Oui je sais pour les scénarios web … c’est en place ici .
https://statuts.ilinux.fr/zabbix.php?action=dashboard.view
(mais leur serveur est lent … et impossible de faire du https ou telnet 25 depuis le serveur zabbix )

Note : Je suis en train a de migrer chez ovh pour la partie supervision ext, (c pas mes potes mais bon, leur vps est mieux dimensionné avec du ssd …)

je me sers du proxy zabbix, (avec encryption du traffic), et ça roule nettement mieux :wink:

@anon6747921 Tu as mis le serveur zabbix sur le serveur proxmox ? ou tu as mis une VM / Lxc dédié pour cela ?

non juste une vm vps chez ovh .

j’ai proposé fut un temps (moins d’un an ) un monitoring croisé entre CHATONS mais bon : comme d’habitude mon idée fût boudée, mais as usual , reviendra par une autre personne en disant "regardez on a mis des fiches de services CHATON " !!!

Allez sans rancune.

Moi j’avance, notamment sur la V2 d’ilinux !

et du coup tu surveilles tes proxmox ? et les LXC / VM qui sont dedans ?

je surveille mes sites, dns , mx etc …

  • un accés avec un agents zabbix en DMZ (qui relaie).
    lequel agent surveille quelques trucs en interne (le firewall par exemple !)