Gros travail de mise à jour en cours.

Un grand chantier de mise a jour de l’ensemble de la plateforme vers la nouvelle version de Debian est en cours sur lautre.net depuis quelques jours. Comme a chaque mise a jour majeure des distributions, l’équipe technique travaille serveur par serveur dans chaque grappe de machine.

Ainsi chaque mise à jour est effectuée sur l’un des frontaux (web, mail etc …) mais jamais simultanément sur les deux serveurs de façon à garantir le service en cas de problème. De cette manière, si l’une des mise à jour devait mal se passer, le service continuerait à être opérationnel, en mode certes un peu dégradé mais opérationnel tout de même.

C’est justement ce que nous vivons actuellement, preuve s’il en faut que la méthode n’est pas mauvaise.

Nous rencontrons des soucis sur la couche NFS de GNU/Debian Squeeze, qui semble mal fonctionner en l’état. Nous sommes en train d’investiguer pour comprendre où se situe le problème et avons donc décidé de stopper les mises a jour des autres frontaux tant que ce ne sera pas résolu.

De fait, actuellement, sur les deux frontaux web, l’un d’eux sert 90% de la charge de la plateforme (plusieurs milliers de sites web) ce qui explique les quelques latences que vous pouvez constater.

Le second frontal web (nouvellement migré) ne sert que 10% de la charge (avec difficultés).

Il faut comprendre que le service NFS nous permet de lier les serveurs web, mail, etc… au contenu hébergé sur la plateforme. Il est donc vital que la communication se passe bien et ce n’est pas le cas.

Plus nous équilibrerons la charge, plus le service sera lent, plus ce serveur sera lent et plus il ralentira les serveurs de fichier.

Parrallèlement à cela, nous sommes en train de finaliser les mise à jour d’un autre serveur (Elga pour les intimes), le serveur qui héberge :

  • le service de machine virtuelle SSH,
  • le calcul des statistiques web,
  • le service jabber en test.
Une troisième machine, etna, qui sert de frontal mail est aussi en cours de mise à jour, et est actuellement coupée tant que les services ne seront pas correctement reconfigurés.

Si tout se passe bien les services de statistiques web, ainsi que le service de machines virtuelles devrait être de retour ce soir ou au pire a la fin du week-end.

Nous ne manquerons pas de vous tenir informés sur l’évolution de ce travail en alimentant le présent billet.