Coupure momentanée de la plateforme (Maj 22h15)

15h45 : Suite aux problèmes rencontrés pendant le week-end, l’équipe technique a décidé d’effectuer un redémarrage complet de la plateforme. Compte tenu du nombre de serveurs, une coupure momentanée mais totale des services est en cours.

Nous mettrons à jour dès que les services seront revenus, merci de votre patience.

16h15 : Nous sommes dans l’attente de l’intervention d’un technicien du datacenter où sont hébergés nos serveurs. Cette intervention prend malheureusement plus de temps que prévu…

16h38 : Le technicien est intervenu, poursuite du redémarrage des services.

17h27 : Les services sont repartis, mais les pages Web dynamiques sont toujours extrêmement lentes…

22h15 : Les services devraient être revenus à la normale.

Intervention du 23/24 mai 2009

Une intervention d’envergure a été effectuée ce week afin de mettre a jour la plate forme de l’association. Au programme des réjouissances :

– Réinstallation des backups mail, systeme, html en backup croisés sur les deux serveurs de fichier
– Mise a jour des systèmes (debian etch) vers Debian Lenny. Cette mise à jour importante sur le plan sécurité a été appliquée sur les machines suivante :
– elga (serveurs hébergeant machines virtuelles et stats web)
– emma (webserver 1)
– ella (webserver 2)
– etna (mailserver primaire 1)
– eyra (mailserver primaire 2)
– elsa (bureau et mailing list)
– Migration des serveurs web (ella et emma) vers apache2 et optimisation des configurations
– Suppression definitive de eaccelerator (precompilateur PHP) et remplacement par APC

Un énorme travail a été effectué sur alternC (le logiciel gérant le panel d’administration) afin de fournir au projet nos patchs et évolutions.

De ce travail est née une nouvelle version proposée a la communauté (AlternC 0.9.10-PRE1) qui sera validée dans les jours a venir (+ de 11000 lignes de code proposées).

Reste à valider :

– listes de diffusions (mailman) a stabiliser, et réinitialiser les listes des utilisateurs maudits par la derniere panne du serveur de fichier
– statistiques web (a priori ok mais à vérifier après rotation journalière demain lundi 25 mai 2009).

Dans le cas où vous constateriez des soucis sur votre compte ou un quelconque service de l’association, nous vous demandons d’ouvrir un ticket sur l’interface de gestion de bug :

http://bugs.lautre.net

N’oubliez pas d’etre le plus précis possible et de préciser le login de votre compte et vos coordonnées pour que nous recontactions.

[update 26 mai 2009]

– Les listes mailman sont de nouveau fonctionnelles.
– Le serveur d’authentification (freeradius) est de nouveau opérationnel, l’accès a usenet est donc possible de nouveau.

Correction d’un bug dans les relances de cotisation

Un bug quelque peu ancien a été corrigé dans la journée. Depuis la mi septembre 2008, les avertissements jusqu’alors envoyés aux membres 60 jours et 30 jours avant échéance de leur cotisation ne fonctionnaient plus. Seul le message d’alerte une fois l’échéance passée était envoyé.

Le bug a été corrigé et une série de rappel de cotisations a donc été envoyée en fin de matinée. Nous espérons que cela pourra réduire le nombre de paiements en retard. Au passage, pensez à vérifier que l’adresse de contact de votre compte est toujours valide et active.

Appel à contibution – groupe de travail “Aide-rédaction”

Un nouveau groupe de travail baptisé “Aide – rédaction” vient d’être mis en place. Ce groupe sera chargé de :

  • dans un premier temps, restructurer le wiki aide pour le rendre ergonomique
  • dans un second temps, compléter le wiki aide
  • dans un troisieme temps, faire de la veille sur la liste aide et sur les changements lautriens pour completer le wiki au fur et a mesure

Le but serait d’avoir, à terme, un wiki agréable, complet et tenu à jour.
Ça serait beau, n’est-ce pas ?

Pour cela, nous comptons sur vous. Nous invitons donc les personnes intéressées à se rendre dans le bureau Alternc, et d’aller dans la section “Inscription aux listes” pour s’inscrire à la liste aide-redac@listes.lautre.net.

Migration des données vers les nouveaux serveurs de fichier.

Les nouveaux serveurs de fichiers venant remplacer Defi (notre ancien filer et sa baie de disques SCSI) sont arrivés et installés dans notre baie.
Une longue opération de maintenance visant a synchroniser les données et a basculer sur les nouveaux serveurs va débuter.

Durant cette opération, plusieurs coupures de services sont a prévoir notamment a partir de ce dimanche soir 1 mars 2009.

Nouveau routeur

Un nouveau routeur est entré en fonction cette nuit, en remplacement de l’un des deux anciens routeurs, ayant montrés des signes de faiblesse. Son voisin ira le rejoindre tout prochainement, pour obtenir un accès fiable et redondé à la plateforme.

Service de gestion de bugs

Un service de gestion d’incidents a été mis en production, ouvert à tous les adhérents, pour signaler une défaillance et demander une réparation du service.

Il est disponible sur http://bugs.lautre.net/ ; il est conseillé de se créer un compte sur le système pour pouvoir suivre l’évolution des tickets d’incident qui y seront créés.

Corruption de données

En fin de matinée du 7 janvier, le filer de notre plateforme a perdu sa baie de disques. L’alimentation de ses disques a été interrompue.

Le temps de comprendre ce qui s’était passé, et le temps de relancer le filer pour qu’il vérifie les partitions de données (ce qui a pris plus de 2h), additionnés de quelques effets de bords, le service a été rétabli à 16:15 ; la page d’indisponibilité a été brièvement enlevée, le temps de vérifier que des données avaient été corrompues par la panne de la baie.

Un arrêt du filer pour procéder à un examen approfondi, et une réparation de la partition de données a été lancée. Procédure qui a pris plus de 24h.

Sur la période, l’ensemble des services de l’Autre Net a été interrompu, ne laissant qu’une page d’indisponibilité à la connaissance des visisteurs des sites web hébergés.

Les comptes ayant fait des modifications de fichiers le 07-01 (transferts de fichiers) ont perdu des données. Les bases de données n’ont rien.

Les sites du type SPIP, utilisant des fichiers de cache doivent se faire réinitialiser le cache, mais tous les ajouts d’articles sont conservés. Les images et fichiers joints ajoutés ce jour là par contre, sont probablement corrompus.

  • Un backup intégral du 18-12 est à disposition des adhérents pour récupérer les données qui ont été perduse.
  • des recherches sont possibles sur les fichiers corrompus, pour retrouver des données importantes modifiées entre le 18-12 et le 07-01.