Accueil > TechMag > Conseils de pro > Les différents rôles de la bande
Les différents rôles de la bande
TechMag - Conseils de pro
Mercredi, 23 Septembre 2009 09:05

Introduction
Une analyse des différents rôles que jouent les technologies à bande dans l'informatique d'aujourd'hui.


Cet article est une traduction d'un article original d'un spécialiste de la sauvegarde.

Je vais commencer par définir trois principaux domaines (stockage, sauvegarde et récupération de sinistre), suivis des critères à prendre en compte pour les choix technologiques dans ces domaines. Cela posera les bases d'une brève comparaison entre les bandes et les technologies et solutions concurrentes.
Avertissement de l'auteur: Ce document contient des phrases, analyses et opinions qui sont entièrement de mon fait et ne représentent pas nécessairement la position de Tandberg Data.


 

Définitions

Les définitions suivantes sont de mon fait et sont basées sur ce que je crois être une position de consensus. Puisqu'il n'y a pas de définitions standards, de nombreux lecteurs auront l'habitude de définir certains termes différemment. J'espère toutefois avoir inclus suffisamment de flexibilité pour rendre ce document utile même à ceux qui ne partagent pas mon approche.

Stockage
Cela définit typiquement les données de production, c'est-à-dire les données utilisées régulièrement pour faciliter les tâches de production, comme des documents, présentations, feuilles de calcul, bases de données, etc. Cependant, cela peut inclure d'autres données comme des fichiers personnels (photos de vacances, lettres, etc.).
Selon l'importance de ces données et de leurs fréquences d'accès, il est possible de les classer par niveaux, ou selon une hiérarchie multiniveaux. Le meilleur exemple de cela est appelé gestion de stockage hiérarchisée (HSM). Le principe est que le matériel utilisé pour stocker les données varie en termes de performances, de disponibilité et de sécurité (et de fait en terme de coûts) en accord avec les critères précédents. Par exemple, les fichiers de DAO (dessin assisté par ordinateur) peuvent nécessiter une disponibilité constante, éventuellement pour plusieurs utilisateurs simultanément, et requièrent donc une excellente bande passante jusqu'à leur position ainsi qu'un matériel très performant (CPU, mémoire, système de disques). D'un autre côté, une présentation de produit d'un projet vieux de trois ans nécessitera rarement un accès et peut donc être stockée sur une plateforme moins onéreuse.

Sauvegarde
Dans l'optique de ce document, la sauvegarde est supposée ne s'appliquer qu'aux données, ce qui signifie que les systèmes d'exploitation, applications, etc. ne sont pas pris en compte. L'objectif de la sauvegarde est la capacité de restaurer des données qui ont disparu de leur position de stockage pour une quelconque raison (erreur humaine, défaillance matérielle, virus, etc.). La manière la plus aisée de faire une sauvegarde est de réaliser une copie conforme des données considérées et de les conserver à un emplacement différent de l'original.

Récupération de sinistre
Cela est défini dans ce document comme la possibilité de restaurer un système ou environnement entier (matériel et logiciel) en cas de défaillance critique. Des exemples pourraient être un serveur détruit ou volé, ou même un problème affectant une salle serveur entière (incendie ou surcharge électrique). Dans ces cas, il ne suffit pas de restaurer les données, mais il peut être nécessaire de remplacer le matériel et restaurer des installations complètes comprenant OS et applications en plus des données.



Définir les besoins

Il y a clairement de multiples produits qui peuvent être utilisés dans les trois domaines cités ci-dessus. Par exemple les serveurs et appareils avec disques Fibre et SCSI/SAS, les solutions basées sur des disques externes ou amovibles, les médias optiques et bien sûr, la bande.
Dans cette section, j'analyse quelques critères qui aideront à décider quel type de produit est le plus adapté pour une tâche, en tenant compte des exigences et contraintes qui sont propres à chaque environnement.

Taille de la société
Ce point prend en compte le nombre d'employés, le nombre de serveurs et stations de travail, les recettes et le nombre d'emplacements physiques, mais aussi l'image sur le marché.
Analyser ces facteurs aidera à clarifier la complexité de l'environnement informatique et la facilité d'implémentation de certaines solutions (par exemple, si la société possède plusieurs sites connectés avec une bande passante suffisante, on peut envisager une solution maison incluant la réplication ou d'autres formes d'externalisation). Si la compagnie a une réputation de fiabilité, de professionnalisme et de réactivité, la nécessité de préserver ou même améliorer cette réputation peut impacter les décisions liées aux investissements informatiques.

Secteur d'activité
L'activité de la société détermine aussi au moins en partie le type de produit nécessaire. La production multimédia, par exemple, requiert une puissance de calcul importante et une grande bande passante tandis que les cabinets d'experts-comptables exigent un haut degré de sécurité et de disponibilité.

Les compétences et les ressources informatiques maison
La simplicité est-elle un facteur prépondérant ou est-il possible d'installer et de maintenir des environnements et stratégies complexes en interne, autorisant ainsi un plus haut degré de contrôle et d'autonomie ?

Analyse des coûts et budget
Pour beaucoup, le facteur le plus important est sans doute comment obtenir le maximum avec une contrainte budgétaire donnée. Par exemple, toutes les données sont-elles stockées sur le même type d'appareil haut de gamme sans budget restant pour implémenter ne serait-ce qu'une solution basique de sauvegarde ? Ou est-il meilleur de s'assurer des ressources adéquates à tous les niveaux en analysant plus précisément les besoins ?
De même, lors du calcul du coût d'une solution donnée, il est important de regarder plus loin que les investissements initiaux et d'inclure tous les éléments tels le service et la maintenance, le coût des médias (disques ou bandes additionnelles) ainsi que la consommation électrique, la dissipation thermique et l'espace au sol. L'énergie nécessaire à l'alimentation et au refroidissement d'un équipement informatique est souvent sous-estimée, mais peut être significative sur la durée de vie de la solution (typiquement 3 à 5 ans).
Finalement, c'est une bonne pratique de placer les investissements informatiques dans un contexte de protection de l'activité. Cela signifie que les sociétés devraient essayer de faire une évaluation précise des pertes directes et indirectes qui seraient liées à une perte de productivité par des problèmes informatiques qui sont irrécupérables ou trop longs à corriger.

Volume et priorité des données
Cela a déjà été abordé au point 4, mais peut être étendu. Une analyse et catégorisation des données n'a pas seulement un impact sur le média de stockage, mais également sur les sauvegardes. Toutes les données nécessitent elles d'être sauvegardées à chaque fois ? Comment réduire les coûts des matériels, des consommables et des licences logicielles en implémentant de meilleures politiques et stratégies ?

Conformité et obligations légales
Est-ce que la compagnie fait face à des exigences extérieures qui doivent être remplies, comme une période de stockage minimum pour certains types de données (possiblement plusieurs années), des obligations d'externaliser les données et/ou les sauvegardes à un endroit différent sur une base régulière, fournissant des pistes de vérification inaltérables sur demande ou assurant que les informations sensibles ne sont pas accessibles aux groupes et individus non autorisés ?

Politiques internes
La plupart des sociétés d'une certaine taille ont mis en place des politiques informatiques qui régissent au moins une part de leur infrastructure : affectations des quotas de stockage, droits d'accès, nécessités de backups, récupération des catastrophes, etc. Quelques sociétés vont plus loin et mettent en place des accords de niveaux de service avec leur département informatique (ou leurs fournisseurs externes). Ils peuvent stipuler un temps d'indisponibilité maximum pour des parties spécifiques de l'infrastructure, des délais maximums pour la restauration des données perdues ou la récupération de machines entières.

 



Placer la bande dans le contexte

Comme toutes les technologies, la bande a des avantages et des inconvénients par rapport aux autres technologies. Savoir si les avantages l'emportent sur les inconvénients comparés à une solution concurrente dépendra de chaque situation individuelle avec ses propres nécessités et contraintes. Ce qui importe est d'être averti des fonctions et caractéristiques de la bande et de les mettre dans le contexte d'une nécessité de solution spécifique (qui peut être analysée en utilisant les points précédents).
Concernant les fonctions et caractéristiques de la bande dans le contexte des trois domaines mentionnés au début de ce document (stockage, sauvegarde et récupération de sinistre), je voudrais lister les suivants:

Capacité
Considérant la technologie LTO de milieu et haut de gamme, la capacité non compressée est actuellement de 800 GB par cartouche LTO-4. L'augmentation future des capacités est assurée par une roadmap incluant LTO-5 et LTO-6, ainsi que par les recherches et développements en cours.

Performance
La performance maximum actuelle est de 120 GB/s (LTO-4), bien que la capacité du lecteur ne soit qu'une partie d'une équation complexe. À cause des opérations d'écriture séquentielle des lecteurs de bande, la performance maximum peut uniquement être atteinte dans un environnement optimisé qui envoie les données au lecteur à un rythme assez élevé pour éviter les opérations de départ et d'arrêt.

Coût de mise en oeuvre total
Il est important de considérer les facteurs au-delà du prix d'achat initial du matériel et des médias. Un calcul exact du coût total prendra aussi en compte l'addition de capacité si nécessaire, ainsi que le coût d'alimentation et de refroidissement de la solution sur sa durée de vie. Dans certains cas comme les data centers, l'espace nécessaire au sol et en rack représente aussi un certain coût, tout comme le service, la maintenance, l'indisponibilité, etc.

Médias amovibles et transportables
Au coût par gigaoctet de capacité considéré, la bande est le seul média amovible et transportable.

Réduction des données
A ne pas confondre avec compression des données, cette technique réduit le volume de données qui nécessitent d'être transférées et peut être trouvée sur une gamme d'appareils à disques ainsi que dans des suites logicielles indépendantes. Les périphériques à bande peuvent tirer avantage de ce procédé lorsqu'ils sont connectés à un appareil ou un serveur ayant cette capacité.

Compression des données
Réduis la taille des données transférées (les taux de compression dépendent du type de données considéré). Les lecteurs à bande intègrent la compression au niveau matériel, ce qui évite une surcharge du serveur qui serait induite par l'utilisation d'un logiciel de compression.

Chiffrement des données
Cela rend les données illisibles sans la clé (qui doit bien évidemment être stockée dans un emplacement sûr et sécurisé). Les lecteurs à bande (LTO-4 et suivants) peuvent chiffrer au niveau matériel et rendre les données sûres pour un transport et un stockage externe.

Write-Once-Read-Many (WORM)
Crée des bandes qui peuvent être lues de multiples fois, mais pas modifiées (LTO-3 et suivants). Particulièrement utile dans les domaines où l'intégrité des informations est importante.

Conclusion
En extrapolant de tous les points analysés dans ce document, il devient clair que la bande a certainement sa place dans les environnements informatiques d'aujourd'hui et peut proposer une combinaison de caractéristiques et fonctionnalités qui la rende idéale pour certaines taches. De plus, dans certains cas spécifique, elle permet un réel avantage de coût comparé à d'autres solutions. Je conclurai en comparant la bande au disque et à la sauvegarde en ligne. Ces comparaisons, comme le reste du document, ne peuvent prendre en compte toutes les variations des environnements réels des clients et sont donc limitées à une vue d'ensemble.

 



Bande vs Disque


Stockage
La bande est rarement adaptée comme solution de stockage primaire. On peut trouver des exceptions dans des cas où un flux constant de données doit être stocké (par exemple en météorologie ou dans d'autres domaines scientifiques), mais pour une société classique avec des besoins traditionnels (serveurs de fichiers et d'applications, mails, etc), les solutions basées sur disque fonctionnent mieux. Toutefois, considérant le sujet de la hiérarchie de stockage, la bande peut certainement être utile dans l'étage le plus bas du modèle de média de stockage hiérarchisé, fournissant une option économique pour stocker des données non critiques en ligne (c'est à dire dans une librairie) ou pour créer une archive de données anciennes (à la limite, les cartouches ne nécessitent pas seulement d'être stockées en ligne, mais peuvent être transférées à un emplacement dédié).
La décision du support adéquat pour un type de donné sera toujours une décision individuelle motivée par les arguments de la section 3, mais cette réflexion devrait toujours inclure la bande comme option valide.

Sauvegarde
Tandis que le rôle traditionnel de la bande en tant que produit de sauvegarde primaire est lentement accaparé par les solutions à disques, elle reste une part très importante d'une solution de bonnes pratiques. Tandis que les produits à disques peuvent accélérer certaines opérations de sauvegarde et de restauration, ils ne fournissent pas le même niveau de sécurité que la bande. À moins qu'un lien fiable et doté d'une grande bande passante vers une autre localisation existe, les bandes sont un des rares moyens d'externaliser les sauvegardes, c'est-à-dire les emporter hors du site de production, ou au moins dans un endroit ignifugé. En plus, les bandes, une fois écrites, sont difficilement accessibles et ainsi mieux protégées contre les virus, les erreurs d'administrateur et d'utilisateur. Le résultat est que beaucoup de sociétés emploient conjointement le disque et la bande (notamment pour bénéficier d'améliorations de performances) plutôt que d'éliminer complètement la bande.
Récupération de sinistre
La bande reste la solution la plus économique pour restaurer des machines entières (en conjonction avec le logiciel approprié bien sûr). Comme pour les sauvegardes, le fait que la bande soit amovible, transportable et peu chère au gigaoctet la rend idéale pour cet usage.


Bande vs Sauvegarde en ligne

Bien que la sauvegarde en ligne généralement gérée par une compagnie tierce puisse être extrêmement attractive pour certains consommateurs, il y a quelques points qui doivent être vérifiés et pris en compte avant de faire la décision finale.

Bande passante
La bande passante est-elle assez large et fiable pour garantir des sauvegardes régulières et des restaurations quand elles sont nécessaires.

Défaillances de la connexion
Que se passe-t-il quand la connexion entre le site de production et la localisation de la sauvegarde est indisponible pendant une longue période ? Est-ce que les sauvegardes et restaurations peuvent être effectuées dans un délai raisonnable et, si oui, comment (un système de sauvegarde local sera-t-il fourni, installé et configuré ; les médias nécessiteront-ils d'être transportés physiquement entre les deux localisations et, si oui, quelle est la distance entre les deux) ?

Autonomie et sécurité
Si le client est vraiment prêt à mettre ses sauvegardes entre les mains d'une société externe, elle doit impérativement être fiable. Rappelez-vous, si la société de sauvegarde perd ou détruit vos données, cela peut avoir un effet catastrophique sur votre activIté.

Evaluation du coût total (TCO)
Assurez-vous que la comparaison de coût entre les solutions externes et internes prend tous les éléments en compte, par exemple les périodes de rétention, le stockage des sauvegardes accumulées, etc.

Commodité
La plupart des arguments employés par les sociétés de sauvegarde en ligne, tel que l'absence d'erreurs humaines, une longue recherche de restaurations, etc. peuvent être traités en implémentant une solution à bande automatique et éventuellement en ajoutant une couche disque.