3hg est down, est-ce que quelqu'un est au courant de quelque chose?

@prx Merci encore pour ton intervention rapide, et pour tes explications honnêtes sur ce qui s’est passé ces derniers jours. J’imagine que ça n’a pas du être facile à gérer pour toi.

Je pense qu’il est important de procéder à une retrospective concernant ce qui s’est passé. Je vais partager mes pensées dans la suite de ce message. Même si le contenu est critique, j’aimerais insister sur le fait qu’il ne se veut absolument pas être une attaque personnelle. Je pense qu’on peut tirer des leçons en matière de gestion de risque de cet évènement, pour 3hg mais aussi pour les autres chatons :cat:.

Je suis assez surpris que le serveur se trouve derrière une box internet chez un particulier. Surpris parce que ce n’est pas résilient comparé à un serveur situé dans un data center. Pourquoi ? Premièrement, car tout ce qui est coupure internet et problème réseau est généralement plus rare et réglé plus rapidement dans un data center. Deuxièmement, parce que tout repose sur une seule et même personne en cas de pépin. Si cette personne a décidé de partir randonner plusieurs jours sans ordinateur et sans réseau, le problème ne sera pas réglé avant son retour. Pire, si cette personne décède (ne parlons pas de malheur), les utilisateurs sont bien embêtés.

Je comprends la beauté d’avoir 100% le contrôle de son serveur, chez soi. Et en même temps je ne peux pas m’empêcher de me dire que si j’avais su que le serveur était chez un particulier, je n’aurais peut-être pas recommandé à ma copine (qui voulait quitter Google) d’ouvrir un compte chez 3hg. J’aurais pu l’héberger sur un serveur à moi mais, justement, je ne voulais pas prendre la responsabilité (en tant qu’unique admin du serveur) de la disponibilité de son service mail. Tout simplement parce qu’il aurait pu m’arriver quelque chose. Je me rends maintenant compte que j’ai transféré cette responsabilité sur une autre personne (unique).

Il était également impossible de joindre 3hg (ou plutôt @prx) parce que le domaine de son adresse mail (ybad.name) était également devenu inaccessible (car certainement également hébergé chez lui). @prx était mon seul point de contact, et heureusement que ce forum et le chan IRC #chatons existaient (merci encore à @Thomas et @linuxmario pour leurs réponses rassurantes).

En ouvrant un compte chez 3hg, j’avais l’impression d’ouvrir un compte administré par un collectif (et pas par une seule personne). Sur le site de 3hg (https://3hg.fr), tout m’indique qu’un collectif administre le serveur, ce qui laisse supposer que le serveur est partagé entre ses administrateurs et donc très probablement hébergé dans un data center. J’aurais aimé qu’il soit clair dès le départ que (1) le serveur est administré par une seule personne, (2) le serveur est situé chez cette personne derrière sa ligne internet de particulier.

1 « J'aime »

Merci d’aborder ce sujet avec ces précautions d’usages. :smiley: J’ai lu avec attention ce fil de discussion. Je me permets quelques remarques avec les mêmes précautions.

Je trouve très honnête de ta part de faire part de ta surprise. Il me semble que 3hg.fr ne fait pas mystère du fait que ses services sont auto-hébergés derrière une box sfr. Tu as peut-être sauté cette case parce que tu as été habitué à ce que ton gmail.com fonctionne tout le temps, même si c’est moins vrai aujourd’hui. Nous avons tendance à l’oublier mais c’est le premier axiome de l’ux-design selon google, amazon et les autres : nous faire penser que leurs services fonctionnent tout le temps et pour tout le monde.
Ce n’est pas une critique ou un jugement moral de ma part car nous sommes tous concerné·es.

Attention à ce que tu mets derrière le mot résilient. Tu confonds peut-être avec un taux de service. L’adhésion au manifeste ou à la charte des chatons n’implique pas un taux de service à 100%. Ni une obligation de résultats. Sauf, évidemment, si le chaton s’engage contractuellement sur un taux de service. Mais même dans ce cas, cela suppose que le chaton s’engage contractuellement à un retour à la normale si le service est défaillant.

Rétrospectivement, il me semble que le service fourni par 3hg.fr a été down quelques jours, mais est revenu à la normale. Je ne sais pas dire si il y a eu perte de mail, etc. Je ne saurais pas mettre un chiffre sur son Qos. Mais à la louche, je le trouve plutôt bon. Et, comme tu l’as toi même dit, 3hg.fr a été transparent sur cet incident.

Sur le mot résilient… chacun·e sa défintion. Chaque année à l’occasion de l’AG de google|alphabet, certains actionnaires interrogent le board d’alphabet sur la résilience de l’entreprise dont ils sont actionnaires. Du point de vue de ces actionnaires, une entreprise avec moins de 100 000 salariés et un salaire médian de 258000$/an (2019) n’est ni éthique, ni résiliente, même si elle est parfaitement «décarbonée». (Je mets des guillemets pour prévenir un dérapage trollesque sur ce sujet)

Enfin, de mon point de vue, la résilience du collectif des chatons réside, entre autres, dans la diversité des choix dans les modes d’hébergements. Cela fait partie d’une culture numérique (littératie numérique) large et inclusive qui s’oppose fréquemment à une littératie médiatique.
@tgy si je te pose cette question, comment tu te situes : Suis-je un citoyen éclairé ou un consommateur éclairé?

Mes mails sont sur mon propre serveur dédié depuis des années (opensmtpd + dovecot, configuré par mes soins). Je ne me sens donc pas concerné par cet habitus dont tu parles, celui d’oublier la réalité de l’absence de garantie quant-à ces services gratuits proposés par les géants du web. Je n’ai donc pas sauté cette case et suis pleinement conscient que c’est également le cas pour 3hg.

Concernant le fait que « 3hg.fr ne fait pas de mystère du fait que ses services sont auto-hébergés derrière une box sfr ». Je viens de re-consulter le site de 3hg et, à moins d’avoir loupé quelque chose, je ne vois pas où cela est mentionné. Pour moi, ce n’est pas clairement annoncé sur le site. Si c’est annoncé quelque part, je trouve problématique que, même en cherchant spécifiquement cette information sur le site pendant plusieurs minutes, je ne l’ai pas trouvée.

Je ne sais pas s’il y a d’autres utilisateurs de 3hg ici qui peuvent partager s’ils sont également surpris ou bien s’ils étaient également au courant.

Par résilient je ne voulais pas entendre taux de service mais anticipation des risques. Je voulais dire organiser l’administration du service de telle sorte qu’en cas de gros pépin (coupure internet pendant plusieurs jours, accident grave ou décès de l’unique administrateur, etc.) la pérennité du service (et des données des utilisateurs, ici les mails) ne soit pas compromise. Je suis bien conscient qu’il n’y a aucune obligation contractuelle à assurer ce service gratuit (et merci à toi @prx pour le temps que tu passes à administrer les services proposés par 3hg), et heureusement d’ailleurs.

Si je comprends bien, tu veux dire que si quelqu’un n’est pas content du service proposé par un chaton, il·elle peut changer de chaton facilement parce qu’il y en a d’autres ? Une sorte de gestion de risque par diversification ? Si oui, j’entends cette idée mais, en l’occurrence, dans le cas des mails, je ne suis pas d’accord pour dire que c’est une stratégie viable. Si j’utilise mon adresse robert@3hg.fr pendant X années, je ne peux pas facilement changer de chaton pour héberger mon service de mail. Cela nécessite de changer d’adresse mail pour robert@4ih.net mais mes contacts ont l’habitude de me contacter sur robert@3hg.fr. Cela fait maintenant plusieurs années que j’ai basculé sur mon serveur mail perso et je reçois toujours des mails sur mon adresse gmail.

Je ne comprends pas trop cette question, ni où tu veux en venir. J’ai l’impression que tu me demandes si je suis convivialiste ou capitaliste néolibéral. Je pense que la réponse est assez évidente quand on soutient des projets comme chatons.org.

La bonne pratique sera d’acheter son nom de domaine et tu pourras changer de prestataire comme tu veux. Je suis auto-hébergé chez moi donc je rentre absolument dans le spectre de ta critique. J’héberge aussi les mails de ma moitié et elle a acheté son propre nom de domaine pour aller ailleurs si besoin (problème technique, séparation, décès).

L’anticipation des problèmes ne résoud qu’une portion de merdes qui arrivent. Pour travailler avec de grands hébergeurs de données (gandi, ovh, microsoft), les interruptions/dégradations de services ne sont pas rares du tout. Sont-ils résilient selon toi ? Pour avoir traité de grosses emmerdes avec eux, j’ai de gros doutes.
Je pense qu’il faut arrêter de penser que tout doit marcher tout le temps et bien. 3 jours de down sur une année, c’est quedal, surtout pour du mail qui est un service asynchrone.

Enfin, je suis très heureux que des auto-hébergés existent car c’est ce qu’il faut faire aujourd’hui, pour le bien de ses données.

1 « J'aime »

Alors on était bien 3 au départ à administrer. La via a fait que les 2 autres membres ont dû en priorité s’occuper de leurs familles. Après quelques temps en retrait, ils sont désormais de retour, bien que ce soit moi qui me charge en priorité du serveur puisqu’hébergé chez moi.

Tout est fait pour que le service ne tombe pas, en tout cas tout ce que je peux à mon échelle : onduleur contre les coupures de courant, backup sur disque du chiffré lui aussi. Les raisons pouvant faire tomber les services sont peu nombreuses :

  • Incendie ou vol
  • coupure de l’accès à internet (comme ces derniers jours)
  • décès de l’admin
    Ces risques existent aussi pour un datacenter, mais dans une moindre mesure puisqu’il y a plusieurs personnes pour reprendre le flambeau.

On n’a jamais cherché à faire de mystère, on détaille ici l’infrastructure, tu aurais sans doute voulu qu’on y ajoute « auto-hébergé chez un particulier » :
.
Ceci dit, dans lesmentions légales, ça semble évident.

Je pense que si on n’est pas prêt à accepter ces « risques » inhérents à une solution à échelle plus humaine que gmail, alors les services d’un CHATONS ne sont pas adaptés.
Un datacenter, c’est bien mignon, mais ça suppose reporter sa confiance pas seulement en l’administrateur mais aussi en la personne ou la société qui s’occupe du datacenter. On peut avoir chiffré tout ce qu’on veut, à partir du moment où on a un accès physique à un serveur, ça devient très facile de le compromettre. Voilà pourquoi je tiens à conserver les données chez moi.

Par ailleurs, j’héberge principalement un service mail. Les mails, ça se télécharge et se sauvegarde avec un client comme Thunderbird. Ce n’est pas comme si je proposais un service cloud.

Ceci dit, il semble qu’il faille améliorer la doc de 3hg.fr en tenant compte des remarques ci-dessous. Je travaille aussi sur une méthode de contact qui ne dépendrait pas de mon accès à internet.

1 « J'aime »

Je suis d’accord avec cet avis et je vais considérer la question pour ma partenaire (qui est chez 3hg).

Je ne pense pas que tout doive marcher tout le temps et bien. Tu me prêtes un avis qui n’est pas le mien. En revanche, 3 jours de downtime d’affilé sans aucune communication de la part des administrateurs du service et alors qu’on attend des mails très importants auxquels on est forcé de répondre rapidement, ça fait vite froid dans le dos. On se pose rapidement toutes sortes de questions sur ce qui peut bien se tramer côté admin (qui, je suppose, font du monitoring et ont un système d’alerte en cas de panne).

Pour avoir travaillé avec OVH, je n’ai eu un problème qu’une fois (panne de disque) en presque 10 ans, et ça a été réglé quasiment immédiatement. Alors que je ne suis qu’un tout petit client pour eux. On a eu deux expériences différentes semblerait-il. Pour répondre à ta question : oui ils le sont selon moi.

Je suis très content qu’ils existent aussi. Je n’ai absolument pas dit « l’auto-hébergement, c’est le mal ». Je n’aurais simplement pas choisi d’héberger un service mail sur un serveur situé chez un particulier derrière une box SFR. Choix personnel. J’aurais dû mieux me renseigner au préalable. Pour ma défense, c’est la première fois que j’utilisais un service chatons.org. Cette expérience est formatrice parce que je saurai me renseigner à l’avenir.

Évidemment, la question était plus de l’ordre de la réception de nouveaux mails importants pendant cette période de flou.

Excellente idée. Cette méthode, comme tu l’as souligné, aurait bien pu être le forum sur lequel a lieu notre conversation.

La question de l’auto-hébergement est moins importante que la question de la communication lors de cet événement. S’il y avait eu une communication claire, dès que tu avais eu connaissance des problèmes, qui disait « On est au courant qu’il y a un problème. Quelqu’un de 3hg est sur le coup. », tout ceci se serait passé beaucoup mieux côté utilisateurs. Je me suis rendu sur ce forum et sur tes différents comptes Mastodon (ton blog et ton mail étant indisponibles) sans y voir de message. Mon point de vue est que, lorsqu’on prend la décision (citoyenne :+1:) d’héberger des services comme un service de mail, on choisit aussi de prendre certaines responsabilités vis-à-vis des utilisateurs de son service. Derrière ces « utilisateurs », il y a des humains, avec des émotions. Qui se demandent pourquoi ils ne reçoivent plus de mails depuis 3 jours. Qui sont sans nouvelles des administrateurs malgré leurs tentatives pour les joindre. Qui peut-être attendent des mails importants (e.g. en pleines démarches administratives pour changer de logement, doivent envoyer un mail pour rendre un examen, etc.).

Je salue tous tes efforts @prx, et la (superbe) installation que tu as mise en place chez toi. Je suis très heureux que des citoyens comme toi existent et s’engagent comme tu le fais. Cette conversation n’a encore une fois pas du tout pour objectif de remettre en question l’existence de 3hg ou ses méthodes. J’avais d’ailleurs choisi 3hg parmi les autres chatons parce que le collectif m’inspirait et me donnait confiance, que le site et sa documentation étaient bien réalisés et que je t’avais trouvé très réactif par mail quand j’avais eu quelques questions, au début. Bref, continue c’est super :+1: .

2 « J'aime »

J’ai tout à fait conscience que c’est la communication qui a posé problème. Je n’avais moi même plus d’accès à internet du tout, et j’ai avant tout voulu résoudre le problème et n’avait certainement pas la tête froide pour trouver une solution afin de communiquer (ce forum ayant été la solution la plus évidente). Je n’ai plus de compte mastodon depuis un petit moment non plus.

Comme tu l’as dit, il y a des "

humains avec des émotions

j’en étais le premier affecté comme tu peux t’en douter.

La solution sera facile à apporter si ça arrive de nouveau : j’ai un autre nom de domaine qui servira justement à ça, je dois juste le configurer.

Là encore, j’entends le reproche et le comprends. Je ne peux que me défendre de ne pas être un professionnel en marketting, qu’un simple particulier qui propose un service sur son temps libre. Mais je vais progresser suite à cette mauvaise expérience :slight_smile:

4 « J'aime »

Je m’en doute. Comme dit plus haut, je réalise que ça n’a pas du être facile à gérer pour toi. Surtout si tu n’avais pas le temps de gérer une telle situation, avec les obligations de la vie quotidienne.

L’événement s’est plutôt bien terminé et je suis sûr qu’on sera plusieurs (au moins 2 !) a en avoir tiré quelque chose de bénéfique.

Merci encore pour tout @prx !

Bonjour à tous,

Je vais commencer par me présenter : Starsheep, un des admins de 3hg, mais pas administrateur du serveur car la serveur est très loin de chez moi… :thinking:

Alors tout d’abord je viens de lire l’intégralité du fil de discussion, et c’est clair qu’il y a eu des manquements au niveau de la qualité du service. Non seulement du fait de l’interruption des services 3hg, mais surtout, et cela est moins pardonnable je pense, du fait de l’absence totale de communication sur l’incident.

Pour ce qui est de la communication, je plaide coupable car j’étais effectivement informé du problème, mais à aucun moment je n’ai pensé à venir ici pour informer sur le problème. De plus, globalement, nous n’avions rien prévu pour informer les utilisateurs, en dehors des services 3hg, qu’un incident était en cours…

On va travailler à améliorer tout cela, et encore une fois, pour tous les utilisateurs des services 3hg, je tiens à m’excuser personnellement pour cette gestion d’incident quelque peu hasardeuse…

Merci pour votre compréhension.

6 « J'aime »

le plus à blâmer et celui qui ne fait rien … donc c’est moi ! :smiley:

le collectif 3hg a trop laissé @prx faire le taf sans se soucier du reste… ça va changer, pour le bien de ce cher prx et par la même occasion, celui des utilisateurs/trices des services 3hg.fr.
comme pour pas mal de choses, on espère une année 2021 bien meilleure que 2020 :stuck_out_tongue:

oops … grillé par @Starsheep

bon bah voilà, le collectif au complet vous présente ses excuses et va bosser pour rendre 3hg encore meilleur :wink:

5 « J'aime »

coucou les copains :stuck_out_tongue:

Il y a un truc simple à mettre en place : une page de statut posée ailleurs que chez vous :slight_smile: Typiquement, j’ai aussi un serveur chez OVH et j’ai posé un cachet dessus : https://status.deblan.org/
En cas de panne et/ou grosse intevention sur mes services (qui ne sont hébergés que chez moi), je laisse un message dessus. Les gens peuvent recevoir un mail et s’abonner via RSS.

3 « J'aime »

je pense que c’est une chose que l’on va mettre en place rapidement :slight_smile:
et aussi … car ça reste du grand classique … un accès IRC via freenode sur #3hg :wink:

2 « J'aime »

Vu que c’est un problème qui peut potentiellement affecter tous les chatons, avoir une section dédiée ici serait peut-être une bonne solution ? Les hébergeurs peuvent annoncer les problèmes, le reste de la communauté proposer son aide en cas d’incident.

5 « J'aime »

Ça me semble une bonne idée :+1:

1 « J'aime »

Il me semble qu’il y a déjà un topic sur ce forum sur ce sujet . L’idée de passer est cachet est en effet une solution rapide et simple à mettre en place , c’est là => https://forum.chatons.org/t/important-mise-en-oeuvre-dun-groupe-de-travail-pour-realiser-stats-chatons-org/1303

J’arrive après la guerre le bug, mais je tenais juste à signifier à l’ensemble des protagonistes ici que ce que je viens de lire est pour moi une réelle fierté de ce à quoi doit ressembler un collectif.

Non pas un truc qui ne plante jamais (ça n’arrive pas, et « pour pousser, il faut se planter »), mais parce que chacun a su :

  • décrire son problème
  • indiquer les conséquences/impacts
  • chercher de l’aide
  • trouver des solutions
  • s’expliquer
  • s’accepter comme on est (faillible)
  • proposer de l’aide
  • tirer des leçons.

Le tout dans un dialogue respectueux de chacun et de ses contraintes.

C’est peut être un détail pour vous, mais pour moi ça veut dire beaucoup :slight_smile:

Donc : merci !

7 « J'aime »

C’est d’ailleurs ce qu’il y a de plus beau ! Bravo ! :slight_smile:

D’ailleurs, je me permets d’ajouter un petit retour suite à cet incident : je me suis rapproché des admins de 3HG pour mettre en place un système de surveillance en commun.
En gros, sur un serveur de secours chez ARN, j’ai installé une instance PHPServermon qui surveille les services d’Automario et les services de 3HG et qui envoie un mail en cas de panne et en cas de rétablissement. Chacun de nous possède un compte admin pour ajouter des services à surveiller et on peut ajouter librement des utilisateurs qui seront informés par mail en cas de problème.

Pour ceux qui sont intéressés, je mettrai en place une documentation sur ma plateforme (je vais mettre à jour celle existante). Si jamais, vous pouvez me contacter au besoin :slight_smile:

3 « J'aime »

merci pour ce service qui va bien servir ! :smiley: ou pas j’espère, fin bref, merci :slight_smile:

@Starsheep et @prx sont en train de tout mettre en place et on vous donne des news dès que c’est prêt pour que d’autres puisse éviter de reproduire nos erreurs :wink:
++
arp