Le simple fait que seule une petite partie des données en croissance exponentielle et rapidement vieillissantes soit souvent consultée et utilisée amène chaque organisation à réfléchir à une stratégie d’archivage efficace. C’est primordial pour assurer une conservation et une gouvernance des données rentables à long terme. Les équipes informatiques ont pour tâche de trouver des options de stockage à la fois efficaces et économiques, qu’il s’agisse d’une archive active offrant un accès immédiat aux données ou d’une archive en profondeur pour les fichiers froids. Dans ce blog, nous allons examiner trois options d’archivage couramment utilisées ainsi que comparer et analyser leurs avantages et leurs capacités respectives.
1 – Stockage objet sur site
Cette option est couramment utilisée par les entreprises pour stocker et protéger les données au sein de leur data center et dans le cadre de leurs propres stratégies de sécurité informatique et de gouvernance des données. Généralement, les entreprises achètent une appliance de stockage objet clé en main auprès des principaux fournisseurs de stockage ou créent un cluster de stockage objet personnalisable et évolutif, configuré avec un software-defined storage et un accès S3/HTTP. La résilience et la durabilité sont intégrées à l’architecture.
2 – Stockage sur le cloud public
Le stockage sur le cloud public (basé sur le stockage objet S3) est intéressant pour ceux qui préfèrent recourir à un fournisseur tiers pour héberger et gérer l’infrastructure de stockage. Nul besoin de vous soucier des opérations informatiques ni de l’augmentation ou de la réduction de la capacité en fonction des exigences de l’entreprise. Les fournisseurs d’hébergement proposent différents SLA de durabilité et de disponibilité répondant à divers besoins. Bien que l’approche entièrement cloud ne soit pas encore très répandue, l’adoption du cloud hybride est en plein essor. Il consiste à répartir le stockage des données entre des emplacements sur site et sur le cloud public ou privé, en fonction des besoins de l’entreprise.
3 – Bande LTO
Le stockage sur bande au format ouvert Linear Tape-Open (LTO) est utilisé pour stocker des données à long terme, en particulier lorsque le stockage hors ligne est une exigence. Les lecteurs de bande servent à stocker des données froides qui n’auront pas besoin d’être récupérées dans un avenir prévisible. Ils sont généralement placés en sécurité dans des emplacements hors site offrant une couche supplémentaire isolée de protection des données d’archives.
Comparaison des stockages d’archives
Chacune de ces options de stockage présente des avantages selon les cas d’utilisation. Comparons-les à l’aide de ces différents critères pour vous aider à déterminer celui qui correspond le mieux à vos besoins particuliers.
Stockage objet sur site | Stockage sur le cloud public | Bande LTO | |
---|---|---|---|
Emplacement | Data center sur site, sites secondaires/DR, succursales distantes | Hors site : hébergé dans le cloud public | Data center sur site, espace sécurisé hors site |
Encombrement du stockage de données pour les organisations | Dépend de la stratégie de capacité de stockage et de protection des données appliquée | Nul, car toutes les données sont stockées dans le cloud public | Dépend de la stratégie de capacité de stockage et de protection des données appliquée |
Coûts | Coût d’investissement initial (CAPEX) pour l’appliance/le matériel selon les besoins, et coût d’exploitation (OPEX) simple et prévisible pour les services de données et la gestion ultérieure (éventuellement avec un software-defined storage) | Aucun coût d’infrastructure sur site. Mais des coûts imprévisibles, tels que les frais de sortie, qui s’accumulent chaque année, le coût de récupération des données archivées, le coût du WAN, les coûts indirects liés à la migration des données vers le cloud. | Coûts initiaux en CAPEX pour le matériel du lecteur de bande. Faibles coûts de fonctionnement pour entretenir et remplacer les cartouches. |
Sécurité des données | Application de stratégies de sécurité internes, du chiffrement, de l’authentification, etc. Contrôle granulaire (au niveau de l’objet) pour répondre aux normes de sécurité et de conformité. | Gérée par le fournisseur d’hébergement : aucune flexibilité pour appliquer des règles de sécurité organisationnelles | Application de stratégies de sécurité internes, du chiffrement, de l’authentification, etc. La définition de stratégies granulaires est difficile au niveau de la bande. Une fois les règles définies, il est difficile de modifier la configuration initiale par la suite. |
Protection des données | Stratégies de protection des données flexibles en fonction des besoins. Stockez des copies redondantes sur site ou copiez sur un site/cloud secondaire. Des capacités d’auto-réparation supplémentaires protègent contre la dégradation et la corruption des données. | Dépendance totale vis-à-vis du fournisseur de services pour maintenir des niveaux de durabilité élevés basés sur le SLA | Plusieurs copies de sauvegarde peuvent être stockées sur des lecteurs de bandes dans différents sites pour la récupération |
Accessibilité des données | Archive toujours active à la demande : mieux adaptée aux flux de travail collaboratifs, à l’accès distribué et à la diffusion de contenu | Latences d’accès supérieures et pertes de service occasionnelles (selon la qualité de la connexion Internet) | Temps de chargement lents et accès séquentiel : ne convient pas au stockage de données nécessitant un accès instantané |
Facilité de recherche | La gestion de contenu basée sur les métadonnées simplifie la recherche de fichiers | La gestion de contenu basée sur les métadonnées simplifie la recherche de fichiers | La recherche n’est possible que via des applications de stockage telles que les solutions de gestion des actifs multimédias. |
Récupération en cas d’interruption de service | Récupération rapide avec des segments et des répliques de code d’effacement | Dépendance à l’égard des SLA des fournisseurs de services cloud pour la résolution du problème et la récupération des données | Plus l’accès fréquent, plus le risque d’usure est élevé. La récupération est complexe. |
Effort de gestion du stockage | Un effort très minime est nécessaire pour la gestion, en particulier lors de l’utilisation du software-defined storage | Nul, car tout est pris en charge par le fournisseur de services et entraîne des frais supplémentaires | La gestion n’est pas si simple. Un effort manuel est nécessaire pour changer de cartouches, déplacer les bandes entre différents emplacements, etc. |
Actualisation du matériel | Les nœuds ont généralement un cycle d’actualisation de 5 ans. Avec un software-defined storage, il est facile d’effectuer une migration des données sur place et d’actualiser le matériel sans interruption. | Entièrement géré par le fournisseur de services. | Une intervention manuelle importante est nécessaire lorsque vous changez de support et que les lecteurs vieillissent et doivent être mis à niveau. De plus, la migration des données entre différentes générations de LTO n’est pas très facile. |
Accès à un seul fichier et à des fichiers en masse | Bien adapté aux deux | Mieux pour un seul fichier ou un plus petit nombre de fichiers en raison des frais de sortie | Mieux pour les récupérations en masse (par exemple, ensemble de production), car une fois le support chargé, les débits de flux sont rapides |
Comme nous l’avons vu dans le tableau ci-dessus, chaque approche présente des avantages et des limitations très clairs. En fin de compte, ce sont vos besoins qui déterminent la bonne option de stockage à utiliser. Et souvent, aucune n’est à privilégier à l’exclusion des autres. Pour les entreprises qui souhaitent sécuriser et protéger leurs données en interne, une solution de stockage objet sur site ferait l’affaire. Pour d’autres organisations, une combinaison de ces solutions avec un stockage objet sur site servant d’archive active serait idéale.
Examinons un exemple d’utilisation d’une combinaison de ces options. Vous pouvez utiliser une plateforme économique de stockage objet sur site pour délester les NAS/serveurs de fichiers principaux des données rarement consultées. Ce serait votre principale archive active.
- Migrez facilement les données inactives, les fichiers multimédias volumineux, les sauvegardes, etc. vers cette plateforme de stockage objet sur site évolutive et accédez rapidement à tous ces éléments en cas de besoin.
- Conservez et protégez ces données pendant de nombreuses années en fonction de la stratégie de sécurité de votre organisation et des obligations de conformité en matière de stockage des données en local.
- Ces données peuvent ensuite être déplacées vers une archive en profondeur dans le cloud public ou sur bande pour un stockage à plus long terme.
Vous pouvez créer plusieurs copies de données (pour redondance) dans le même emplacement sur site ou sur un site secondaire. Comme vous avez la possibilité de choisir le support de stockage, vous pouvez stocker votre sauvegarde principale sur un disque dur interne ou un serveur physique et une copie secondaire sur un support amovible comme une bande. Vous pouvez également envisager d’opter pour une DR hors site sur le cloud (les outils de hiérarchisation cloud sont utiles dans ce cas).
Discutez avec un spécialiste en archive active de DataCore pour recevoir des conseils sur les modes les plus appropriés de stockage et de protection de vos données. Notre plateforme de stockage objet software-defined Swarm peut représenter un choix économique et sécurisé au sein de votre data center, évoluer à la demande et offrir un accès rapide et facile en cas de besoin.