Rien n’est plus sûr que l’imprévisible
En général, cette maxime s’applique à la vie, mais plus encore à une entreprise. Surtout s’il s’agit de faire en sorte que les données soient disponibles et accessibles à tout moment, de nombreuses incertitudes risquent d’interrompre l’accès aux données, d’affecter leur intégrité et même d’entraîner une perte de données. Tous ces impondérables peuvent avoir un impact négatif direct sur la continuité des activités.
Lorsqu’une interruption affecte vos applications et vos données stratégiques, cela nuit à votre chiffre d’affaires et à votre résultat net. Votre entreprise peut subir des pertes de chiffre d’affaires et des baisses de productivité, et vos coûts opérationnels risquent d’augmenter en raison des retards liés à la résolution du problème et au rétablissement de la situation.
Pour limiter ces risques, les entreprises mettent en place diverses pratiques de continuité des activités et de reprise après sinistre. L’équipe informatique est chargée de s’assurer que les données sont stockées de manière fiable, toujours disponibles et accessibles. Pour ce faire, les services informatiques gèrent de nombreuses mesures pour définir des SLA permettant de déterminer la qualité de service et de répondre aux exigences de conformité. Examinons certaines de ces mesures du stockage des données afin de mieux comprendre leurs implications sur l’entreprise.
1 – Disponibilité
La disponibilité peut simplement être considérée comme la disponibilité du système, c’est-à-dire le pourcentage de temps pendant lequel le système de stockage est disponible et opérationnel, et permet l’accès aux données. Les systèmes à haute disponibilité sont conçus pour limiter les temps d’arrêt et éviter les pertes de service. Toutes les organisations espèrent atteindre une haute disponibilité pour leurs applications et leurs services professionnels. Mais il est impossible d’y parvenir avec un seul composant informatique. La haute disponibilité dépend de nombreux composants de l’infrastructure informatique, notamment de matériels et de logiciels de stockage fonctionnant de concert comme prévu, en réduisant les temps d’arrêt au minimum en restaurant rapidement les services essentiels en cas de panne.
La disponibilité se mesure en général en fonction du nombre de chiffres 9.
1 neuf = 90 % de disponibilité, 2 neufs = 99 % de disponibilité, 3 neufs = 99,9 % de disponibilité, 4 neufs = 99,99 % de disponibilité, etc. Le contraire de la disponibilité est le temps d’arrêt. Ainsi, si un système de stockage a un SLA annuel avec une disponibilité à 7 neufs (99,99999 %), il ne subira que 3,15 secondes d’indisponibilité par an. Vous devez bien comprendre les besoins de votre entreprise et les coûts impliqués pour déterminer et définir vos objectifs de disponibilité. Les fournisseurs de services proposent également des SLA de disponibilité dans le cadre de leurs contrats.
Pour améliorer la disponibilité, les organisations utilisent généralement des techniques de réplication qui créent des copies de données redondantes afin de permettre un accès continu aux données. Pour améliorer la disponibilité des données, il est essentiel d’éviter les points uniques de défaillance.
2 – Durabilité
La durabilité fait référence à la persistance des données en continu. Les entreprises doivent répondre à des objectifs de conservation des données à long terme. Pour y parvenir, elles doivent améliorer la durabilité des données et de l’infrastructure de stockage où elles sont conservées. En particulier pour un stockage objet où les données sont archivées et conservées à plus long terme, il est important d’atteindre une plus grande durabilité. Un haut niveau de durabilité garantit l’absence de dégradation des données, de toute forme de corruption ou de perte de données.
Le RAID seul ne suffira pas. Il est possible d’augmenter la durabilité des données en effectuant des sauvegardes régulières, en répliquant et en traitant les données/objets par code d’effacement, et en activant WORM/l’immuabilité.
3 – Fiabilité
La fiabilité est généralement associée à l’infrastructure qui stocke les données. Elle fait référence à la probabilité que le système de stockage fonctionne comme prévu. Un système de stockage peut être disponible pendant un certain temps, mais il est possible qu’il ne fonctionne pas comme prévu. Dans ce cas, la fiabilité sera faible. Divers facteurs contribuent à accroître la fiabilité d’un système. Il n’est pas facile de mesurer la fiabilité. Un indicateur de fiabilité couramment utilisé est le temps moyen entre les pannes (MTBF). Le MTBF est le temps écoulé prévu entre les pannes inhérentes d’un système de stockage lors de son fonctionnement normal. Si le MTBF est élevé, cela indique un faible niveau de fiabilité.
Il peut être utile de préparer des procédures de test complètes, couvrant les scénarios de production en temps réel et les cas extrêmes, pour configurer un système de stockage résistant aux pannes. Un dimensionnement, une configuration, une maintenance matérielle et des mises à jour ou des correctifs logiciels appropriés contribuent également à améliorer la fiabilité.
4 – Résilience
La résilience décrit la capacité d’un système de stockage à s’auto-réparer, à récupérer et à continuer de fonctionner après une panne, une coupure, des incidents de sécurité, etc. Une haute résilience ne veut pas dire que la disponibilité des données est élevée. Cela signifie simplement que l’infrastructure de stockage est suffisamment équipée pour surmonter les perturbations. La résilience n’est pas une mesure autonome. Elle englobe la continuité des activités, la réponse aux incidents et les techniques de récupération pour réduire l’ampleur et la durée des événements perturbateurs.
Un indicateur de résilience est la mesure du temps moyen de réparation (MTTR), qui désigne le temps nécessaire pour que l’infrastructure de stockage soit opérationnelle après une panne. Plus le MTTR est bas, meilleure est la résilience.
La résilience d’un système de stockage peut être améliorée grâce à la redondance et au basculement, ainsi qu’en intégrant une intelligence software-defined pour détecter automatiquement les problèmes et effectuer une auto-réparation en peu de temps.
5 – Tolérance aux pannes
La tolérance aux pannes est similaire au concept de disponibilité, mais va encore plus loin pour garantir l’absence de temps d’arrêt. Alors qu’un système de stockage haute disponibilité peut donner lieu à des interruptions de service minimes, un système tolérant aux pannes n’en aura aucune. Comme sa conception est plus complexe, le système tolérant aux pannes est généralement assez coûteux à entretenir : il implique d’exécuter des copies actives-actives de données à tout moment et de disposer de l’automatisation nécessaire pour effectuer un basculement si l’un des composants du système de stockage tombe en panne et provoque une interruption. Ce basculement s’effectue sans aucun temps d’arrêt, de sorte qu’il n’a aucune incidence sur l’accès aux applications et aux données et que l’entreprise peut poursuivre ses activités comme prévu.
La mise en miroir synchrone est largement utilisée dans le monde du stockage pour permettre la tolérance aux pannes. Les données du stockage principal sont mises en miroir de manière synchrone sur un autre périphérique de stockage situé sur le même site ou dans un cluster métropolitain. Les mécanismes automatiques de basculement, de resynchronisation et de rebasculement garantissent un accès continu aux données et la continuité des opérations de l’entreprise malgré les interruptions. L’objectif de point de récupération (RPO) et l’objectif de temps de récupération (RTO) sont maintenus à zéro pour un système entièrement tolérant aux pannes.
Disponibilité vs durabilité vs fiabilité vs résilience vs tolérance aux pannes
J’espère que vous comprenez mieux en quoi consistent ces mesures de stockage de données stratégiques et leurs différences. Les architectes font sans cesse des compromis entre la réalisation des plus hauts niveaux de ces critères et les coûts supplémentaires qu’ils impliquent (à la fois financiers et en termes de latence). Veillez à en tenir compte de manière appropriée lorsque vous créez et optimisez votre infrastructure de stockage.