Vad är medeltiden mellan misslyckanden?

Medeltid mellan fel är ett mått på den genomsnittliga tid som äger rum mellan katastrofala systemfel i ett datorsystem. För att beräkna medeltiden mellan fel måste ett system fungera och sedan misslyckas. Systemet repareras sedan och sätts i drift igen, där det så småningom kommer att misslyckas igen. Tiden mellan dessa fel är det första värdet under medeltiden – eftersom systemet ackumulerar fler fel blir medeltiden mer exakt.

Det finns två grundläggande termer som utgör detta koncept: medeltid och misslyckande. Den typ av medelvärde som avses är ett aritmetiskt medelvärde, mer känt som ett medelvärde. Som med alla medelvärden, ju fler siffror som används för att beräkna medelvärdet, desto mer exakt blir slutresultatet. Eftersom datorsystem inte ständigt misslyckas, är medeltiden i allmänhet ett genomsnitt från ett stort antal olika system som alla används och byggs på liknande sätt.

Den andra stora delen av termen är misslyckande. I datortermer finns det många olika typer av fel. I det här fallet är felet en total avstängning av systemet. Systemet är trasigt över dess förmåga att fortsätta fungera och måste repareras innan det kan tas i bruk igen. Om en enskild del av datorn går sönder, som ett enda minne, betraktas det inte som ett fel när man beräknar medeltiden mellan felen. Dessutom är schemalagda driftstopp som underhåll inte ett misslyckande.

Dessa värden används ofta som ett tidigt varningstecken för odiagnostiserade hårdvaruproblem. Om medeltiden för ett system mellan fel är mycket kort, så finns det uppenbarligen ett problem i systemet någonstans. Datordesigners tittar också på vad som orsakade felet förutom hur lång tid det tog. Detta ger en tydligare indikation på var problemet kan finnas och vad som måste hända för att det ska åtgärdas.

Underhållspersonal använder den genomsnittliga tiden mellan fel för att utforma sitt systemunderhållsschema. Om ett system pressar sin genomsnittliga tid medan ett annat är månader bort, gör det det lättare att avgöra vilket system man ska arbeta på först. En fullständig översyn och kontroll kommer inte tekniskt att återställa ett systems medeltid, men det bör skapa längre intervall mellan fel, vilket effektivt pressar medeltiden högre.

Medelvärdet för tiden mellan fel är bara ett av många värden som används i dator- och tillverkningsindustrin för att beteckna systemfel. Andra vanliga termer inkluderar medeltiden till fel, hur lång tid det tar att katastrofalt misslyckas första gången och medeltiden mellan kritiska fel för fel som är viktiga, men som inte tar systemet offline. Det finns också medeltid mellan enhetsbyten, vilket mäter den genomsnittliga tiden innan ett system behöver bytas ut mot ett annat.