Disponibilité

Toutes les disponibilités ne sont pas les mêmes

Qu'est-ce que la disponibilité ?

La disponibilité est un moyen de mesurer la durabilité d'un système. La disponibilité peut être définie comme la durée pendant laquelle un système fonctionne effectivement (ou un service opérationnel), divisée par la durée pendant laquelle le système aurait pu fonctionner.

Quels sont les niveaux de disponibilité habituels ?

Les systèmes sont généralement segmentés en niveaux de disponibilité selon leur nombre de "neuf" et décrits plus en détail en utilisant des termes tels que "hautement disponible" et "haute disponibilité".tolérant aux fautes.” Si un système est disponible 99 % du temps (deux neuf), cela signifie qu'il n'est pas disponible 1 % du temps. Au cours d'une année donnée, avec 525 600 minutes disponibles, vous pouvez vous attendre à ce qu'un système "deux neufs" soit indisponible pendant 5256 de ces minutes, soit pendant environ 88 heures ou 4 jours. En fonction de votre le coût des temps d'arrêtSi l'on ne peut pas se permettre d'avoir des enfants, cela peut coûter cher.

Disponibilité Nombre de neuf Temps d'arrêt par an Souvent décrit comme
99.9% Trois neuf 526 minutes ou moins Disponible à l'adresse suivante :
99.99% Quatre neuf 53 minutes ou moins Hautement disponible
99.999% Cinq neuf 5 minutes ou moins Tolérance aux pannes

Les systèmes fonctionnant à des niveaux de disponibilité moyens supérieurs de "quatre neuf" et "cinq neuf" sont souvent appelés systèmes "à haute disponibilité" ou "tolérants aux pannes".

Quelles sont les méthodes courantes utilisées pour accroître la disponibilité ?

Il existe plusieurs méthodes éprouvées que les entreprises utilisent pour améliorer la disponibilité, allant de l'amélioration de la fiabilité et de la résilience des systèmes, à la mise en œuvre de procédures de sauvegarde et de récupération, ou au déploiement de grappes redondantes (physiques ou virtuelles) avec des services de basculement.

Robuste, sans ventilateur, classé IP-40

Utiliser des systèmes fiables et résistants

Une façon d'améliorer la disponibilité est d'utiliser des systèmes plus fiables. Plus votre système est robuste et fiable, moins il est susceptible de tomber en panne. Moins il tombe en panne, plus il fonctionne longtemps et, par définition, plus il est disponible.

Un autre moyen d'accroître la disponibilité consiste à mettre en place un système plus résistant, capable de rebondir rapidement après un revers. En réduisant le temps nécessaire pour réparer le système et reprendre les services, vous réduisez les temps d'arrêt et augmentez la disponibilité globale. Ce qui est intéressant, c'est que si un système peut rebondir rapidement à chaque fois, la fréquence des pannes importe moins.

Mise en œuvre de la sauvegarde et de la restauration

La fiabilité et la résilience ont cependant leurs limites. Dans de nombreux cas, ce n'est pas seulement la disponibilité du système, mais aussi la protection et l'intégrité des données qui doivent vous préoccuper.

Les entreprises qui adoptent une approche plus globale de la disponibilité sauvegardent souvent leurs données de manière régulière et gardent des systèmes de rechange en stock. Si leurs systèmes de production connaissent une défaillance catastrophique, elles redémarrent les services sur leurs systèmes de rechange, en récupérant les données dont elles ont besoin dans leurs archives.

La mise en place de services de sauvegarde et de récupération nécessite une certaine compétence. Et le temps de récupération peut varier, de quelques heures à quelques jours, selon les applications, la quantité de données et la disponibilité des pièces de rechange.

Utilisation de services de mise en grappe et de basculement natifs et virtuels

Pour certaines entreprises, la reprise des services après quelques heures ou quelques jours peut être acceptable. Mais celles dont les coûts relatifs d'arrêt sont plus élevés ont besoin d'une approche plus résistante, tant pour leurs applications que pour leurs données.

Le clustering et le basculement utilisent le même principe que la sauvegarde et la récupération, mais raccourcissent le temps de récupération des services en faisant certaines choses à l'avance, comme la réplication des systèmes pour qu'ils soient prêts à reprendre au moment voulu. Plusieurs systèmes sont combinés et les données sont partagées par ces systèmes redondants. En règle générale, un système fait office de système principal, permettant aux utilisateurs d'accéder aux applications et aux données, tandis qu'un système secondaire fait office de système de secours, soit en dormant jusqu'à ce que l'on en ait besoin (passif), soit en faisant tourner d'autres applications (actif). En cas de défaillance du système primaire, l'application bascule vers le système secondaire et recommence à y fonctionner, tant que les connexions aux données partagées sont établies.

Avec l'émergence des technologies de virtualisation, les concepts de clustering et de basculement ont été étendus aux systèmes virtuels. Aujourd'hui, les technologies de virtualisation et de mise en grappe sont utilisées pour combiner des systèmes physiques et des applications de basculement fonctionnant sur des machines virtuelles (VM), en tirant parti de la portabilité des VM.

Que propose Stratus ?

Stratus offre une grande variété de solutions edge computing couvrant tout le spectre de la disponibilité. Des produits uniquement logiciels comme everRunà des solutions complètes comme ztC Edge et ftServer qui comprennent du matériel, des logiciels et des services, Stratus aide les clients à fournir facilement et à moindre coût des charges de travail hautement disponibles et tolérantes aux pannes.