Mise à jour OS serveurs de mail

La mise à jour du système d’exploitation (vers Debian 11) de l’un des deux serveurs de messagerie (Roundcube, IMAP, SMTP) a finalement abouti. La configuration historique n’a pas été compatible avec cette mise à jour, ce qui a nécessité une révision complète pour la moderniser.
Pour les utilisateurs aguerris… edna est de retour.
Nous allons laissé quelques jours en observation, et ensuite le second serveur de mail devrait subir la même mise à jour.

Incident certificats

Les certificats lautre.net ont expiré le 6 Septembre
Ceux ci sont paramétrés pour se renouveller automatiquement (let’s encrypt) mais la procédure de mise à jour automatique ne s’est pas déroulée de manière automatique et l’intervention manuelle a nécessité un peu de perseverance.

L’équipe de roots est sur le coup et analyse la situation pour remettre en place le renouvellement automatique.

Panne des services mails et listes de diffusion

Depuis ce dimanche 17 décembre 2023 après-midi, un équipement visiblement mal redondé entraîne des perturbations de service sur l’infrastructure de L’Autre Net.

Les mails et listes de diffusions sont parmi les plus impactés. Les sites internet ne demandant que peu d’accès disque sont fonctionnels.

Un premier passage au centre de données a permis de diagnostiquer une panne d’alimentation. Un second passage ce mardi matin a permis de mettre en production un tout nouveau switch pour résoudre la situation.

Tout est rentré dans l’ordre. Merci pour votre confiance et votre patience.

Panne du filer (coupure web générale)

Entre le 7 et le 11 décembre 2021, suite à une panne, puis une réparation, puis divers souci de reconfiguration du filer (machine de stockage principale) de Lautre Net, l’ensemble des sites web a subi des interruptions de plusieurs heures.

Le filer a été reinstallé et une copie en temps réel est en cours d’installation, qui devrait permettre de rétablir la situation plus rapidement en cas de problème.

Nous sommes désolé de la gêne occasionée, les roots se sont relayés pour réparer ce filer, tout semble OK à ce jour.

Panne du panel & accélération

Bonjour à toutes et à tous,

Suite à un problème de processus de renouvellement pour le certificat wildcar « *.lautre.net », une panne des mails pop/imap ainsi que du panel a eu lieu ce 25 juin 2020 de 8h à 11h.

Après renouvellement du certificat, les services de mail et du panel sont revenus à la normale. Aucun mail n’a du être perdu pendant cette opération

Dans ce contexte, nous avons trouvé un bug dans le code spécifique de Lautre Net dans AlternC, qui provoquait 10 à 12 secondes d’attente à chaque page du panel ! C’est désormais corrigé, et le panel decrait être beaucoup plus rapide !

Indisponibilité dans la nuit du 18 au 19 décembre

Bonjour à tous,

vous aurez peut-être remarqué que vos sites n’étaient pas joignables dans la nuit du 18 au 20 (de minuit et demi à environ 10h du matin).
Notre filer nous a encore fait une blague: pas de perte de données, juste un plantage difficile à diagnostiquer.
Et comme il a eu la bonne idée de faire ça juste après l’heure du coucher des roots, la situation a trainé.

Tout devrait être rentré dans l’ordre.

Indisponibilité du 19/20 février

Nos sites Internet sont restés injoignables pendant quelques heures hier, et certains de nos mails aussi.

La situation devrait être rentré dans l’ordre. C’était du à .. une incompatibilité entre les deux version d’AlternC; l’actuelle et celle vers laquelle nous migrons. Désolé pour le désagrément!

filer HS

Update (samedi 15 nov 11h 50): We’re back online!

L’infra (http) est down, parcequ’on a un soucis de filer..
En voulant mettre en prod les SSDs, le kernel n’a pas été aussi content que prévu.

Update (samedi 15 nov, 2h00): la maintenance se poursuit, une opération est terminée, c’est bon signe. Par contre, pour une raison très bête, il faut une intervention humaine. La suite demain matin donc.

En mode plus geek : le volume logique qui contient les données des sites web a bien été migré vers les SSD, mais à cause du crash du kernel, xfs a besoin de reconstruire sa base de quota, avant de monter la partition. Problème: ça explose en consommation mémoire (16G + swap mangés comme des petits pains), du coup mount se fait tuer, et le boot échoue (grosso modo).
Du coup demain matin quelqu’un (merci encore encore liazo) devrait aller désactiver les quotas, espérant que ça refasse tomber tout ça en marche.

On vous tient au courant.

Infra down – résolu

Bonjour/Bonsoir,

pour la deuxieme fois « aujourd’hui », l’infra ne répond plus. Hier après-midi, nous avons redémarré le switch (merci Fred!) ce qui a relancé la machine. Vu que les symptômes sont les mêmes, il y a fort à parier que ce soit le switch qui refasse des siennes.

Bref, on sait, on s’en occupe, il faut le changer, et configurer le nouveau. Normalement rien ne sera perdu, la magie d’avoir plusieurs serveurs mails.

Désolé pour la gène occasionnée.

Grâce à un switch de prêt (merci aux copains de chez Liazo) on a pu remettre l’infra d’aplomb. Une maintenance sera à prévoir lorsque nous recevrons nos switch dans les jours à venir pour repasser en fonctionnement nominal. Merci particulièrement à olive, fremo et cephick!

Attaque DoS en cours sur la plateforme

Bonjour,

Une partie du routage vers notre plateforme est actuellement bloquée suite à une attaque contre nos serveurs par Déni de Service de plusieurs Gbps en amplification DNS : en terme simple, une tempête si forte qu’on n’a d’autres choix que de fermer les volets en attendant que le calme ne revienne.

Si vous avez des difficultés à consulter vos e-mails avec votre logiciel habituel, vous pouvez accéder au webmail

N’hésitez pas à rejoindre nos bénévoles sur IRC

Mise à jour – 11/02/2014 :

Nous avons décidé de répartir les sites sur plusieurs adresses IP pour ventiler le plus possible. Nous espérons donc pouvoir identifier les sites visés, pour potentiellement les isoler; évitant de paralyser toute l’infra. Il se peut donc que vous ayez des soucis de résolution DNS.

Excusez la nature technique de nos propos, mais nous n’avons pas le temps de rendre cela plus simple. Je vous invite donc de nouveau, à rejoindre nos bénévoles sur IRC pour de plus amples informations. Attention, temps de réponse non garanti 

Mise à jour – 12/02/2014 :

Un ticket unique a été créé pour centraliser les soucis d’accès à l’infra à l’adresse https://bugs.lautre.net/index.php?do=details&task_id=257