Quel est le temps moyen entre les échecs?
Le temps moyen entre les défaillances est une mesure de la durée moyenne entre les défaillances catastrophiques du système dans un système informatique. Pour calculer le temps moyen entre les pannes, un système doit fonctionner, puis faire une panne. Le système est ensuite réparé et remis en service, où il finira par tomber en panne. Le temps entre ces défaillances est la première valeur du temps moyen. Plus le système accumule de défaillances, plus le temps moyen est précis.
Ce concept est composé de deux termes fondamentaux: temps moyen et échec. Le type de moyenne auquel il est fait référence est une moyenne arithmétique, mieux connue sous le nom de moyenne. Comme pour toutes les moyennes, plus le nombre de calculs utilisés est élevé, plus le résultat final est précis. Étant donné que les systèmes informatiques ne font pas constamment défaut, le temps moyen est généralement la moyenne d'un grand nombre de systèmes différents qui sont tous utilisés et construits de manière similaire.
L'autre grande partie du terme est un échec. En termes informatiques, il existe de nombreux types de pannes. Dans ce cas, l'échec est un arrêt total du système. Le système est en panne, il ne peut plus continuer à fonctionner et doit être réparé avant de pouvoir être remis en service. Si une seule partie de l'ordinateur tombe en panne, telle qu'une simple clé USB, le calcul du temps moyen entre les défaillances n'est pas considéré comme une défaillance. En outre, les temps d'arrêt planifiés, tels que la maintenance, ne sont pas un échec.
Ces valeurs sont souvent utilisées comme un signe avant-coureur de problèmes matériels non diagnostiqués. Si le temps moyen d'un système entre les défaillances est très faible, il y a évidemment un problème quelque part dans le système. Les concepteurs informatiques examinent également la cause de la défaillance en plus de la durée. Cela donne une indication plus claire de l'endroit où le problème peut exister et de ce qui doit être fait pour le résoudre.
Le personnel de maintenance utilise le temps moyen entre les défaillances pour concevoir le programme de maintenance de son système. Si un système repousse son temps moyen pendant que l'autre se trouve dans des mois, il sera plus facile de déterminer le système sur lequel travailler en premier. Une révision et un contrôle complets ne réinitialiseront pas techniquement le temps moyen d'un système, mais devraient créer des intervalles plus longs entre les défaillances, ce qui augmenterait effectivement le temps moyen.
La valeur du temps moyen entre les défaillances n'est qu'une des nombreuses valeurs utilisées dans l'industrie informatique et de la fabrication pour désigner les défaillances du système. Les autres termes courants incluent le délai moyen avant défaillance, le temps nécessaire à la défaillance catastrophique la première fois et le délai moyen entre les défaillances critiques pour les défaillances importantes, sans que le système ne soit mis hors ligne. Il existe également un délai moyen entre le remplacement des unités, qui mesure le temps moyen nécessaire avant qu'un système soit remplacé par un autre.