Prochaines évolutions de Lautre.net

Bonjour,

Les roots de la plateforme ne sont guère bruyant, mais pas mal de choses sont en train de se mettre en place.

Déjà, rappelons l’architecture actuelle :

  • un switch 100Mb pour le réseau interne
  • un switch 100Mb pour le réseau public
  • un serveur de console (accès de secours sur les machines)
  • deux routeurs BGP qui sont aussi répartiteur de charge
  • deux frontaux web (apache)
  • deux frontaux mail (smtp, pop, imap)
  • une passerelle SSH pour l’accès des admin
  • un serveur de fichier dédié aux mails
  • un serveur de fichier dédié aux fichiers web
  • un serveur de bases de données
  • un serveur pour les statistiques et les machines virtuelles
  • un serveur pour le panel AlternC

Pour les curieux, nous rappelons que http://mon.lautre.net/ est à votre disposition.

Cette structure marche bien, et ce depuis plusieurs années, mais nous impose de grosses limitations et a ses points faibles.
Entre autres :

  • des services critiques ne sont pas redondés (mysql, panel)
  • impossible de passer une machine du réseau privé au réseau public sans intervention physique
  • le serveur de console « plante » et a besoin d’un reboot hard
  • impossible de changer les ressources allouées à un service (les serveurs mail ont des centaines de Go d’espace disque et n’en utilisent qu’une dizaine, quand le serveur de statistiques en manque cruellement)
  • impossible de changer simplement un service de machine (les bases de données sont sur une machine physique, si la machine physique est défectueuse, il faut la réparer avant de pouvoir relancer le service)
  • nous sommes très serrés dans la demi-baie que nous louons, et nous manquons donc d’espace
  • nous consommons trop de courant et nous payons un surplus chaque mois
  • nous faisons cohabiter sur la même machines des services très différents ce qui compliquent énormément nos politiques de sécurité (exemple : serveur jabber sur la même machine que les machines virtuelles)

D’autres problèmes sont apparus ces derniers temps :

  • le serveur de statistiques n’a pas assez d’espace disque pour faire ses calculs
  • le serveur de fichier web tiens la charge, mais en cas de pic de charge (brusque hausse de fréquentation, ou mauvaise configuration du site d’un adhérent), il sature et provoque des ralentissements sensibles. C’est important, ça veut dire que nous n’avons pas beaucoup de marge de manœuvre
  • les sauvegardes sont « croisées » : le serveur A sauvegarde le serveur B, et inversement. Quand un problème apparaît sur la sauvegarde, les performances des deux serveurs sont dégradées (pas assez pour que les gens le voient, mais assez pour que les admins s’inquiètent)

Tout cela fait que nous sommes en train de préparer de grosses évolutions sur l’architecture. Vous n’aurez pas de changements notable du point de vue utilisateurs, mais ils nous permettront d’améliorer la qualité de service.
Des coupures seront malheureusement nécessaires pour la mise en place de tout ce que nous prévoyons, mais elles seront organisées et les adhérents seront prévenus à l’avance.

Serveur de fichier web
Le serveur de fichier web va être remplacé par un nouveau serveur. Cela nous permettra d’augmenter l’espace de stockage ainsi que les performances. En outre, on l’a choisi de telle sorte que nous pourrons changer les disques durs pour augmenter les performances sans avoir a éteindre la machine (donc sans coupure).

Réseau
Les deux switch 100Mb non-redondants vont être remplacés par un swich Gigabit. Nous aurons plus de souplesse dans notre architecture réseau.
C’est un investissement que nous envisagions depuis des années, et qui devient nécessaire dans le cadre des changements de l’infrastructure.

Accès de secours aux serveurs
Les machines ne disposant pas d’accès console natif (IPMI), nous avons acheté des cartes d’extensions pour elles, ce qui devrait nous permettre de nous affranchir du serveur de console.

Backups
Le remplacement de l’actuel serveurs de fichiers web par un nouveau fait que nous allons recycler l’ancien serveur pour centraliser les sauvegardes.

Surconsommation / Espace en baie / Possibilité de relancer un service quand une machine est en panne
Gros morceau ça, très gros.
Après pas mal de réflexions, nous avons décidé de virtualiser l’infrastructure. Pour vous, ça ne changera absolument rien, le serveur Eyra sera toujours le serveur Eyra.
Cela nous permettra d’affranchir les services (web, mail, bdd, panel) de leur hôte physique. Ainsi, en cas de problème matériel, nous pourrons « simplement » relancer la machine ailleurs, sans avoir à aller intervenir en urgence.
Un problème type « la carte mère de tel serveur a grillé » ne sera plus un problème de jours, mais de minutes.
Une intervention physique sur une machine ne nous forcera plus a couper les services (exceptés les serveurs de fichiers, qui pour des raisons de performances ne seront pas virtualisés).
Sauf que pour virtualiser, il faut de nouvelles machines, et ça coûte cher. Très cher. Et avec les frais de Switch et du serveur de fichiers, cela commençait à être un budget très conséquent.
Dans nos pérégrinations, nous avons eu la chance de pouvoir récupérer des serveurs de deux sociétés en train de renouveler leur parc et qui les ont cédés à diverses associations, sans demander aucune contrepartie. Nous remercions chaleureusement Fotolia et F-Secure pour leur gentillesse et leur générosité.
Grâce à leur dons, nous allons pouvoir remplacer certaines de nos machines vieillissantes et énergivores par des machines plus performantes et plus adaptées à nos besoins.

++++++++++++++++++++++

Voila, je pense vous avoir globalement expliqué ce sur quoi nous travaillons depuis quelques mois.

Où nous en sommes :

  • 2 des 5 serveurs gracieusement donnés sont déjà en notre possession
  • le nouveau serveur de fichiers a été reçu
  • le switch est en commande

Notre organisation des semaines à venir :

  • fin décembre nous récupérons les trois machines que nous devons encore récupérer
  • début janvier, nous recevons le switch
  • mi-janvier, nous achetons les petites fournitures nécessaires (câbles réseaux, disques durs, étiquettes…)
  • fin janvier nous intervenons physiquement en salle système pour mettre en place la nouvelle architecture.

Vraisemblablement, nous interviendrons un samedi en pleine journée, et nous devrons couper toute l’infrastructure lautre.net « le temps que ». Ce temps de coupure sera a priori de quelques heures, mais nous tenterons de le minimiser au mieux. Des dates et des horaires vous serons communiqués dès que nous aurons une visibilité sur ce sujet.

Et sinon, certains d’entre vous nous remontent des bugs sur le panel AlternC, sachez que nous prévoyons la mise à jour en version 1.0 pour la fin du premier trimestre 2012. Délai non contractuel ;-).

Merci aux adhérents qui font vivre l’association,
Merci aux messages de soutiens que nous recevons lors des pannes,
Et joyeux Noël à tous !

Associativement,
Fufroma, pour les roots