Aplikasi komputer yang paling penting memerlukan desain yang mencakup beberapa komponen yang berlebihan. Desain toleran kesalahan ini biasanya mencakup perangkat keras, perangkat lunak, cadangan daya, dan tindakan pengamanan kegagalan jaringan. Toleransi kesalahan adalah desain yang memastikan aplikasi komputer akan tetap berfungsi jika terjadi kegagalan katastropik. Sebagian besar bank, pemerintah, dan perusahaan utilitas menggunakan desain jenis ini untuk aplikasi penting mereka.
Toleransi kesalahan daya adalah desain teknik yang menyediakan beberapa saluran masuk daya ke peralatan komputer. Beberapa contoh redundansi daya mencakup beberapa sirkuit daya, penyedia saluran masuk daya, atau sistem cadangan baterai. Sistem ini akan secara otomatis menghidupkan daya cadangan jika layanan listrik terputus.
Rencana daya cadangan yang dirancang untuk melestarikan sistem komputer biasanya mencakup generator bertenaga bahan bakar dan unit baterai besar. Ketika data center kehilangan daya listrik, sistem generator secara otomatis menjadi aktif. Bangunan ini biasanya dapat mempertahankan daya selama beberapa minggu tanpa memengaruhi kinerja secara keseluruhan.
Toleransi kesalahan perangkat keras adalah desain yang mendistribusikan proses bisnis melalui beberapa komponen komputer. Hal ini memungkinkan aplikasi untuk tetap berfungsi ketika sebuah peralatan gagal karena masalah mekanis. Basis data berkerumun adalah contoh penggunaan perangkat keras yang toleran terhadap kesalahan. Dalam desain ini, database fisik didistribusikan dan direplikasi melalui beberapa perangkat keras. Jika ada peralatan yang gagal dalam cluster, database tetap aktif karena didistribusikan ke beberapa unit perangkat keras.
Toleransi kesalahan jaringan adalah contoh lain dari redundansi dalam sistem komputer. Sebagian besar operasi pusat data menyertakan konfigurasi toleransi kesalahan jaringan. Ini membutuhkan penggunaan beberapa vendor telekomunikasi dan saluran telepon ke dalam gedung. Jika terjadi kegagalan total oleh satu vendor, penyedia jaringan lainnya akan secara otomatis menggantinya. Jenis konfigurasi ini biasanya memerlukan dua jalur telekomunikasi aktif dalam satu bangunan fisik.
Banyak organisasi besar dan lembaga pemerintah memerlukan toleransi kesalahan untuk mendukung infrastruktur fisik mereka. Ini memastikan bahwa peristiwa bencana yang mencakup kerusakan daya dan kehancuran jaringan tidak berdampak pada operasi bisnis organisasi ini. Sementara toleransi kesalahan tidak menjamin aplikasi tidak akan gagal, itu mengurangi kemungkinan kegagalan sistem lengkap karena masalah komputer.
Institusi pemerintah yang paling kritis mencakup toleransi kesalahan untuk seluruh unit bisnis. Ini biasanya mencakup relokasi personel, peralatan, dan sumber daya yang dapat menopang bencana alam untuk waktu yang lama. Jenis solusi toleransi kesalahan ini biasanya terletak jauh di bawah tanah, di mana bencana alam berdampak kecil pada operasi fisik.