Vad är medeltiden mellan misslyckanden?
Medeltid mellan fel är en mätning av den genomsnittliga tiden som sker mellan katastrofala systemfel i ett datorsystem. För att beräkna medeltiden mellan fel måste ett system fungera och sedan misslyckas. Systemet repareras sedan och tas i drift igen, där det så småningom kommer att misslyckas igen. Tiden mellan dessa fel är det första värdet i medeltiden - när systemet ackumulerar fler misslyckanden blir medeltiden mer exakt.
Det finns två grundläggande termer som utgör detta koncept: medeltid och misslyckande. Den typ av medel som hänvisas till är ett aritmetiskt medelvärde, bättre känt som ett genomsnitt. Som med alla medelvärden, desto fler siffror som används för att beräkna genomsnittet, desto mer exakt är slutresultatet. Eftersom datorsystem inte ständigt misslyckas är medeltiden i allmänhet ett genomsnitt från ett stort antal olika system som alla används och byggs på liknande sätt.
Den andra stora delen av termen är misslyckande. I dator termer, det finns många olika typer av fel. I detta fall är felet en total avstängning av systemet. Systemet är trasigt utöver dess förmåga att fortsätta arbeta och måste repareras innan det kan tas i bruk igen. Om en enda del av datorn misslyckas, liksom en enda minnespinne, betraktas det inte som ett fel vid beräkningen av medeltiden mellan fel. Dessutom är schemalagd driftstopp som underhåll inte ett fel.
Dessa värden används ofta som ett tidigt varningstecken för odiagnostiserade hårdvaruproblem. Om ett systems genomsnittliga tid mellan fel är mycket låg, är det uppenbarligen ett problem i systemet någonstans. Datorutformare tittar också på vad som orsakade misslyckandet utöver längden på tiden. Detta ger en tydligare indikation på var problemet kan existera och vad som måste hända för att det ska åtgärdas.
Underhållspersonal använder medelvärdet mellan misslyckanden för att utforma sitt systemunderhållsschema. Om ett system driver sin genomsnittliga tid medan ett annat är månader bort, gör det lättare att avgöra vilket system som ska arbeta först. En fullständig översyn och check-up kommer inte att återställa systemets medeltid tekniskt, men det borde skapa längre intervall mellan fel, vilket effektivt pressar medeltiden högre.
Medeltiden mellan felets värde är bara ett av många värden som används i dator- och tillverkningsindustrin för att beteckna systemfel. Andra vanliga termer inkluderar medeltid till misslyckande, hur lång tid det tar att katastrofalt misslyckas första gången, och medeltid mellan kritiska fel för fel som är viktiga, men tar inte systemet offline. Det finns också en medeltid mellan enhetsersättningen, som mäter den genomsnittliga tiden innan ett system behöver ersättas av ett annat.