Apa saja Jenis Desain Data Warehouse yang Berbeda?

Gudang data menyimpan sejumlah besar data untuk digunakan di berbagai bidang. Ada dua jenis utama desain gudang data: top-down dan bottom-up. Kedua desain tersebut memiliki kelebihan dan kekurangan masing-masing. Bottom-up lebih mudah dan lebih murah untuk diterapkan, tetapi kurang lengkap, dan korelasi data lebih sporadis. Dalam desain top-down, koneksi antara data jelas dan mapan, tetapi datanya mungkin ketinggalan zaman, dan sistemnya mahal untuk diterapkan.

Data mart adalah tokoh sentral dalam desain gudang data. Data mart adalah kumpulan data yang didasarkan pada satu konsep. Setiap data mart adalah subset data yang unik dan lengkap. Masing-masing koleksi ini sepenuhnya berkorelasi secara internal dan sering kali memiliki koneksi ke data mart eksternal.

Cara data mart ditangani adalah perbedaan utama antara dua gaya desain data warehouse. Dalam desain top-down, data mart terjadi secara alami saat data dimasukkan ke dalam sistem. Pada desain bottom-up, data mart dibuat secara langsung dan dihubungkan bersama untuk membentuk gudang. Meskipun ini mungkin tampak seperti perbedaan kecil, itu membuat desain yang sangat berbeda.

Metode top-down adalah desain gudang data asli. Dengan menggunakan metode ini, semua informasi yang dimiliki organisasi dimasukkan ke dalam sistem. Setiap subjek yang luas akan memiliki area umum sendiri dalam database. Saat data digunakan, koneksi akan muncul antara titik data korelatif, dan data mart akan muncul. Selain itu, data apa pun dalam sistem tetap ada selamanya—bahkan jika data tersebut digantikan atau diremehkan oleh informasi selanjutnya, data tersebut akan tetap berada di sistem sebagai catatan peristiwa masa lalu.

Metode bottom-up dari desain data warehouse bekerja dari arah yang berlawanan. Sebuah perusahaan menempatkan informasi sebagai data mart yang berdiri sendiri. Seiring berjalannya waktu, kumpulan data lain ditambahkan ke sistem, baik sebagai data mart mereka sendiri atau sebagai bagian dari yang sudah ada. Ketika dua data mart dianggap cukup terhubung, mereka bergabung menjadi satu unit.
Kedua desain gudang data masing-masing memiliki titik kuat dan lemahnya sendiri. Metode top-down adalah proyek besar untuk kumpulan data yang lebih kecil. Karena proyek besar juga lebih mahal, itu adalah yang paling mahal dalam hal uang dan tenaga kerja. Jika gudang data selesai dan dipelihara, itu adalah kumpulan besar, berisi semua yang diketahui perusahaan.
Proses bottom-up jauh lebih cepat dan murah, tetapi karena data dimasukkan sesuai kebutuhan, database tidak akan pernah benar-benar lengkap. Selain itu, korelasi antar data mart hanya sekuat penggunaannya. Jika ada korelasi yang kuat, tetapi tidak ada pengguna yang melihatnya, itu tidak akan terhubung.