« Nos outils d’analyse scientifiques produisent d’énormes volumes de données qu’il nous faut gérer, sauvegarder et archiver pour une durée de 5 à 8 ans ».
Dr Jean-Luc EVRARD, directeur adjoint exécutif de
l’IBMP du CNRS de Strasbourg.
Les végétaux sont un modèle idéal pour l’étude du fonctionnement cellulaire dont l’IBMP explore les mécanismes fondamentaux afin de les appliquer aux biotechnologies et à la recherche médicale.
Pour mener ces travaux l’IBMP met en œuvre des technologies de pointe permettant entre autres d’analyser des molécules, produire des protéines, séquencer de l’ADN et faire de la bio-informatique.
« Les données produites par nos plateformes de microscopie, nos spectromètres de masse et appareils pour séquençage du génome croissent de façon exponentielle », explique M. Evrard, Directeur adjoint exécutif de l’IBMP du CNRS de Strasbourg.
« Ainsi, des millions de lectures sont nécessaires pour couvrir la totalité d’un génome avec pour résultat 1 à 2 To de données brutes, à multiplier par les 200 000 plantes étudiées tous les ans. »
Pour conserver ses informations, monter en puissance et établir son Plan de Continuité d’Activités (PCA), l’IBMP a décidé de mettre en place une nouvelle infrastructure redondée hautement disponible, sécurisée et évolutive.
Le Défi
En 2014, l’IBMP a signé un Contrat de plan Etat-Région lui permettant d’acquérir des instruments de microscopie et de spectrométrie de masse de dernière génération produisant des volumes astronomiques de données. « Pour relever ce défi il nous fallait également investir dans une infrastructure robuste et fiable, partie intégrante du dossier » explique M. Evrard.
Choix de la nouvelle architecture
« Nos données étant stratégiques il n’était pas question de les externaliser chez Amazon ou Google. De plus, le datacenter de l’Université de Strasbourg étant à l’époque toujours à l’état de projet et les services centraux du CNRS, trop onéreux pour notre volumétrie, nous avons privilégié une solution interne », résume Jean-Luc Evrard.
Le cahier des charges exigeait une solution éprouvée et évolutive, mais les offres des constructeurs étaient toutes propriétaires ; un problème majeur pour qui ne peut être lié à son fournisseur initial dès lors qu’il faut augmenter la puissance et la capacité de stockage. « Avec DataCore Software, nous avons trouvé une réelle alternative qui nous a libéré de cette contrainte », commente M. Evrard.
C’est dans un séminaire de l’intégrateur Axians Cloud Builder que l’IBMP a découvert l’offre DataCore, 100% logicielle et totalement indépendante du matériel et de l’applicatif. Des clients présents ont mis en avant les avantages et les riches fonctionnalités du produit mais aucun n’utilisait des capacités de stockage similaire à celles de l’Institut qui s’interrogeait aussi sur les performances et la faisabilité financière de sa configuration cible.
Des rencontres organisées par Axians Cloud Builder avec des grands comptes utilisateurs de longue date de la solution ont contribué à emporter la décision. L’intégrateur a ensuite travaillé avec DataCore et Dell pour élaborer une offre commerciale conforme au budget du laboratoire.
Déploiement
Les deux salles, les serveurs Dell et les solutions DataCore et VMware étaient opérationnels dès septembre 2015 tandis que Jean-Luc Evrard et ses deux collaborateurs, François Disdier, Gestionnaire de parc et Magali Daujat, Ingénieur système & réseau, recevaient les dernières recommandations d’Olivier Huffling. Ce consultant avant-vente chez Axians Cloud Builder a supervisé l’installation et en assure personnellement le suivi commercial et technique direct, contractuellement pour 5 ans.
Aujourd’hui c’est l’équipe IT d’IBMP qui gère au quotidien la solution, créant machines et disques virtuels rattachées ensuite aux pools de stockage.
Architecture en place
Auparavant, le stockage des données se faisait sur 2 XSAN Apple 42 U sous Apple Serve et 2 baies de stockage Drobo en iSCSI. Le parc informatique, majoritairement Apple, comprenait aussi 30 serveurs Apple et Dell ainsi que 3 machines virtuelles sous VMware ESXi. La configuration actuelle s’appuie sur 2 salles totalement redondées, distantes de 50 mètres et reliées par fibre optique.
Chacune d’elle est équipée de :
• 4 baies de stockages Dell Compellent SC4020,
• 1 serveur Dell
R720 pour l’hébergement de l’hyper-viseur de stockage DataCore,
• 1 serveur Dell R630 pour la partie VMware,
• 1 switch Ethernet 10 gigabits assurant la connexion entre serveurs VMware,
• 1 switch Fibre Channel 10 gigabits pour les liaisons inter îles, soit le transfert de données bidirectionnelles entre les deux hyper-viseurs DataCore.
Le Plan de continuité des activités (PCA) mis en place concerne autant les parties VMware que DataCore.
Deux anciens serveurs Dell et les baies de stockage en iSCSI ont été récupérés pour l’archivage.
Applications les plus stratégiques gérées sous DataCore
Parmi les applications ou plateformes les plus critiques de l’IBMP, on peut citer : Solarix (spectromètre de masse métabolique dernière génération rattaché à la plateforme de métabolomique et sa dizaine d’instruments, 1 To de données brutes produites par jour), Plantiquette (application très critique pour décrire les caractéristiques et la vie des 200 000 plantes transgéniques de l’IBMP, collection unique au monde) ;
Séquençage nouvelle génération (plateforme d’analyse des génomes) ;
Microscope confocale et électronique (génération d’images numériques 2D, 3D et 4D sous plusieurs longueurs d’ondes) ;
Omero (base de données-catalogue des images précédentes) et… 200 postes de travail Apple sauvegardés chaque heure avec Time Machine.
Bénéfices
Outre son indépendance hardware complète et son évolutivité garantie, l’offre DataCore apporte souplesse et facilité d’intégration avec VMware et prise en charge de l’environnement Apple. La fiabilité du système a été testée à l’occasion de 3 coupures électriques causées par l’arrachement de lignes HT. Redémarrage et synchronisation sans perte ont été réalisés grâce aux options CDP (Continued Data Protection) et Auto Fail over – Fail back de DataCore.
ROI et conclusion
Après 18 mois de fonctionnement et un budget global à 360 000 € respecté, main d’oeuvre et équipements annexes compris, la satisfaction est au rendez-vous. « Notre coût au téraoctet, redondé et sécurisé, se situe entre 300 et 350 €, un bon prix sur le marché actuel », estime M. Evrard. « Notre liberté de choix est préservée et comme nous avons anticipé en achetant plus de licences DataCore que nécessaires nous pouvons déjà faire face – nous en sommes déjà à 250 To !! – en ajoutant des disques standards pour répondre à la montée en puissance du Solarix et d’un nouveau microscope électronique 3D. »