Apa Berarti Waktu Antara Kegagalan?

Waktu rata-rata antara kegagalan adalah pengukuran jumlah rata-rata waktu yang terjadi antara kegagalan sistem katastrofik dalam sistem komputer. Untuk menghitung waktu rata-rata antara kegagalan, sistem perlu beroperasi dan kemudian gagal. Sistem kemudian diperbaiki dan dioperasikan kembali, di mana pada akhirnya akan gagal lagi. Waktu antara kegagalan ini adalah nilai pertama dalam waktu rata-rata—karena sistem mengumpulkan lebih banyak kegagalan, waktu rata-rata menjadi lebih akurat.

Ada dua istilah dasar yang membentuk konsep ini: waktu rata-rata dan kegagalan. Jenis mean yang dimaksud adalah mean aritmatika, yang lebih dikenal dengan rata-rata. Seperti semua rata-rata, semakin banyak angka yang digunakan untuk menghitung rata-rata, semakin akurat hasil akhirnya. Karena sistem komputer tidak terus-menerus gagal, waktu rata-rata umumnya rata-rata dari sejumlah besar sistem berbeda yang semuanya digunakan dan dibangun dengan cara yang sama.

Bagian besar lainnya dari istilah ini adalah kegagalan. Dalam istilah komputer, ada banyak jenis kegagalan. Dalam hal ini, kegagalan adalah sistem shutdown total. Sistem rusak di luar kemampuannya untuk terus beroperasi dan harus diperbaiki sebelum dapat kembali beroperasi. Jika satu bagian komputer gagal, seperti stik memori tunggal, itu tidak dianggap sebagai kegagalan saat menghitung waktu rata-rata antara kegagalan. Selain itu, waktu henti yang dijadwalkan seperti pemeliharaan bukanlah suatu kegagalan.

Nilai-nilai ini sering digunakan sebagai tanda peringatan dini dari masalah perangkat keras yang tidak terdiagnosis. Jika waktu rata-rata sistem antara kegagalan sangat rendah, maka jelas ada masalah dalam sistem di suatu tempat. Desainer komputer juga melihat apa yang menyebabkan kegagalan selain lamanya waktu. Ini memberikan indikasi yang lebih jelas tentang di mana masalahnya mungkin ada dan apa yang perlu terjadi untuk memperbaikinya.

Personil pemeliharaan menggunakan waktu rata-rata antara kegagalan untuk merancang jadwal pemeliharaan sistem mereka. Jika satu sistem mendorong waktu rata-ratanya sementara yang lain masih berbulan-bulan lagi, ini akan memudahkan untuk menentukan sistem mana yang harus dikerjakan terlebih dahulu. Overhaul dan pemeriksaan penuh secara teknis tidak akan mengatur ulang waktu rata-rata sistem, tetapi harus membuat interval yang lebih lama di antara kegagalan, yang secara efektif mendorong waktu rata-rata lebih tinggi.

Waktu rata-rata antara nilai kegagalan hanyalah salah satu dari banyak nilai yang digunakan dalam komputer dan industri manufaktur untuk menunjukkan kegagalan sistem. Istilah umum lainnya termasuk waktu rata-rata untuk kegagalan, berapa lama waktu yang dibutuhkan untuk kegagalan besar pertama kali, dan waktu rata-rata antara kegagalan kritis untuk kegagalan yang penting, tetapi tidak membuat sistem offline. Ada juga waktu rata-rata antara penggantian unit, yang mengukur waktu rata-rata sebelum satu sistem perlu diganti dengan yang lain.