Apa itu Kurva Distribusi Frekuensi?

Kurva distribusi frekuensi adalah jenis statistik deskriptif yang digambarkan sebagai grafik yang menunjukkan frekuensi kemunculan variabel tertentu, di mana x mewakili beberapa ukuran kemunculan variabel dan y mewakili jumlah kasus pada setiap frekuensi. Dengan populasi yang sangat besar, kurva distribusi frekuensi dikatakan menyerupai ideal statistik kurva lonceng dan mengasumsikan sifat-sifat distribusi normal. Kurva lonceng — juga dikenal sebagai kurva normal — diberi nama yang tepat. Ini menyerupai lonceng bulat dengan ujung simetris meruncing ke bawah dan keluar menuju frekuensi nol pada sumbu x. Kurva lonceng dibagi dua oleh rata-rata identik ideal (μ), median dan modus dari semua data yang diukur, dengan setengah dari setiap grafik di kedua sisi.

Ketika kurva distribusi frekuensi sampel diasumsikan memiliki sifat-sifat kurva lonceng yang ideal, maka aspek populasi yang diteliti juga dapat diasumsikan. Selain itu, rumus statistik standar dapat memberikan sejauh mana asumsi tersebut dapat diandalkan. Dengan kurva lonceng yang ideal, rata-rata populasi, median dan modus semua diasumsikan sama. Perhitungan simpangan baku, , kemudian memberikan ukuran “penyebaran” data populasi. Dalam kurva ideal, semua kecuali 0.25 persen dari total data populasi ditemukan dalam plus atau minus tiga standar deviasi dari rata-rata kurva distribusi frekuensi, atau antara -3σ dan +3σ.

Sementara kurva lonceng yang ideal berbeda dari kurva distribusi frekuensi sampel dalam beberapa cara, kurva ini memungkinkan beberapa pemahaman asumsi baik dari populasi sampel dan bahkan lokasi pengukuran tunggal dalam populasi sampel secara keseluruhan. Dalam kurva ideal, 68 persen dari nilai variabel yang diukur dalam sampel, dan mungkin dalam populasi, akan berada dalam satu standar deviasi dari rata-rata di kedua arah, atau -1σ dan +1σ. Bergerak lebih jauh di sepanjang kurva lonceng, nilai untuk 95 persen sampel dan populasi akan ditempatkan dalam plus atau minus dua standar deviasi dari mean, atau -2σ dan +2σ. Di tepi kurva distribusi frekuensi, semua kecuali 0.25 persen termasuk dalam plus atau minus tiga standar deviasi. Pengukuran langka yang terletak pada 0.25 persen di luar ukuran tiga standar deviasi dikenal sebagai outlier dan sering dihapus dari data saat perhitungan inferensial dilakukan.