Apa itu Distribusi Histogram?

Distribusi histogram dalam statistik mengacu pada pola, bentuk, dan lokasi bilah data univariat pada histogram. Bagaimana dan di mana batang didistribusikan dapat digunakan untuk menganalisis dan menarik kesimpulan tentang data. Analisis distribusi histogram penting dalam mengidentifikasi ciri-ciri seperti normalitas data, distribusi multimodal, dan data miring.

Histogram adalah tampilan data univariat yang menggunakan persegi panjang proporsional di area ke kelas atau frekuensi bin untuk menampilkan fitur data secara visual. Titik data dalam histogram diatur ke dalam bin dan distribusi histogram itu sendiri adalah perkiraan visual dari distribusi frekuensi data atau fungsi kepadatan probabilitas. Bentuk sebaran dapat berubah berdasarkan jumlah bin.

Analisis distribusi histogram sering digunakan sebagai pemeriksaan kualitatif untuk normalitas data. Meskipun metode analitis untuk menentukan normalitas ada, histogram dapat digunakan untuk memberikan pemeriksaan akal sehat yang cepat untuk menghemat waktu. Jika data histogram muncul kira-kira genap dan berpusat pada rata-rata, data dianggap normal. Meskipun cepat dan relatif mudah, pemeriksaan kualitatif semacam ini bersifat subjektif dan metode analitis harus digunakan jika diperlukan standar akurasi yang lebih tinggi.

Menentukan apakah kumpulan data menunjukkan kemiringan adalah cara lain analisis distribusi histogram dapat digunakan. Kemiringan data didefinisikan sebagai asimetri yang diucapkan dalam data. Condong negatif, atau condong ke kiri, terlihat pada kumpulan data dengan nilai rendah yang sangat sedikit. Condong positif, atau condong ke kanan, terjadi pada kumpulan data dengan sedikit nilai tinggi. Mengamati distribusi histogram dapat mengungkapkan outlier dan data miring.

Selain mengungkapkan karakteristik data dengan mode tunggal, bentuk histogram juga dapat mengungkapkan karakteristik data multimodal. Kumpulan data multimodal berisi lebih dari satu mode dan dicirikan oleh distribusi frekuensi yang memiliki lebih dari satu puncak atau maksimum. Afiliasi politik di kota, jajak pendapat persetujuan, dan ukuran tubuh lebah adalah contoh kumpulan data yang mungkin multimodal. Mengamati bentuk histogram dan mencatat berbagai puncak dalam data multimodal seringkali dapat memberikan peneliti lebih banyak wawasan daripada perhitungan statistik univariat sederhana.

Analisis histogram dan distribusi data sangat bergantung pada ukuran bin yang dipilih. Dalam prakteknya, jumlah bin dapat diperkirakan dengan mengambil akar kuadrat dari jumlah pengamatan, meskipun ukuran bin lain dapat digunakan. Misalnya, seorang guru dapat memilih untuk menganalisis nilai ujian dengan memilih ukuran nampan yang mencerminkan nilai huruf.