Was ist die mittlere Zeit zwischen Ausfällen?
Die mittlere Zeit zwischen Ausfällen ist eine Messung der durchschnittlichen Zeitspanne, die zwischen katastrophalen Systemausfällen in einem Computersystem verstrichen ist. Um die mittlere Zeit zwischen Ausfällen zu berechnen, muss ein System funktionieren und dann ausfallen. Das System wird dann repariert und wieder in Betrieb genommen, wo es irgendwann wieder ausfällt. Die Zeit zwischen diesen Fehlern ist der erste Wert in der Zwischenzeit. Je mehr Fehler das System akkumuliert, desto genauer wird die Zwischenzeit.
Es gibt zwei Grundbegriffe, die dieses Konzept ausmachen: Mean Time und Failure. Die Art des Mittelwerts ist ein arithmetisches Mittel, besser bekannt als Durchschnitt. Wie bei allen Durchschnittswerten ist das Endergebnis umso genauer, je mehr Zahlen zur Berechnung des Durchschnitts verwendet werden. Da Computersysteme nicht ständig ausfallen, ist die mittlere Zeit im Allgemeinen ein Durchschnitt aus einer großen Anzahl verschiedener Systeme, die alle auf ähnliche Weise verwendet und aufgebaut werden.
Der andere große Teil des Begriffs ist das Scheitern. In Bezug auf Computer gibt es viele verschiedene Arten von Fehlern. In diesem Fall handelt es sich bei dem Fehler um ein vollständiges Herunterfahren des Systems. Das System kann nicht mehr weiter betrieben werden und muss repariert werden, bevor es wieder in Betrieb genommen werden kann. Wenn ein einzelner Teil des Computers wie ein einzelner Memory Stick ausfällt, wird dies bei der Berechnung der mittleren Zeitspanne zwischen Ausfällen nicht als Ausfall gewertet. Darüber hinaus sind geplante Ausfallzeiten wie Wartungsarbeiten kein Fehler.
Diese Werte werden häufig als Frühwarnzeichen für nicht diagnostizierte Hardwareprobleme verwendet. Wenn die durchschnittliche Zeit zwischen Ausfällen eines Systems sehr niedrig ist, liegt offensichtlich irgendwo ein Problem im System vor. Computerdesigner untersuchen neben der Zeitdauer auch, was den Fehler verursacht hat. Dies gibt einen klareren Hinweis darauf, wo das Problem besteht und was geschehen muss, damit es behoben werden kann.
Das Wartungspersonal verwendet die durchschnittliche Zeit zwischen Ausfällen, um seinen Systemwartungsplan zu erstellen. Wenn ein System seine mittlere Zeitspanne erhöht, während das andere Monate entfernt ist, ist es einfacher zu bestimmen, an welchem System zuerst gearbeitet werden soll. Eine vollständige Überholung und Überprüfung setzt die durchschnittliche Zeit eines Systems technisch nicht zurück, sollte jedoch längere Intervalle zwischen Ausfällen erzeugen, wodurch die durchschnittliche Zeit effektiv erhöht wird.
Der mittlere Wert für die Zeit zwischen Ausfällen ist nur einer von vielen Werten, die in der Computer- und Fertigungsindustrie zur Kennzeichnung von Systemausfällen verwendet werden. Andere gebräuchliche Begriffe umfassen die mittlere Zeit bis zum Ausfall, wie lange es dauert, bis das erste Mal ein Totalausfall auftritt, und die mittlere Zeit zwischen kritischen Ausfällen für Ausfälle, die wichtig sind, das System jedoch nicht offline schalten. Es gibt auch eine mittlere Zeit zwischen dem Austausch der Einheit, die die durchschnittliche Zeit misst, bevor ein System durch ein anderes ersetzt werden muss.