Bisakah Statistik Menyesatkan?

Ada pepatah lama bahwa angka tidak bisa berbohong, tetapi pembohong tahu cara menghitung. Dalam arti tertentu ini mewakili kewaspadaan orang terhadap statistik. Interpretasi statistik dapat menyebabkan data tampak menyesatkan. Itu tergantung pada interpretasi data statistik dan angka apa yang dikedepankan sebagai poin kunci dari laporan statistik.
Misalnya, di sekolah tata bahasa, siswa sekarang mempelajari ukuran tendensi sentral, yaitu mean, median, mode, dan range. Mean adalah jumlah dari semua data, dibagi dengan jumlah data. Misalnya, seseorang mungkin mendapatkan jumlah nilai tes seseorang dan membaginya dengan jumlah tes untuk menentukan nilai. Namun, mean dapat dipengaruhi oleh apa yang disebut outlier, angka yang jauh di luar kisaran normal pengujian. Ini dapat menunjukkan bahwa mean mungkin merupakan cara yang menyesatkan untuk menilai kinerja.

Jika seseorang mengikuti lima tes dengan sempurna dan gagal mengikuti tes keenam sehingga menghasilkan nol, rata-rata mencerminkan hal ini. Jika semua tes bernilai 100 poin misalnya, skor rata-rata adalah sekitar 85%. Namun, ini tidak benar-benar menunjukkan kinerja rata-rata dalam kasus ini karena outlier dari nol.

Ukuran tendensi sentral lain yang dapat digunakan adalah evaluasi median. Median adalah angka tengah dalam sekelompok data yang disusun secara numerik. Jika seorang ahli statistik mengevaluasi median, ini mungkin tidak mewakili rata-rata kinerja yang sebenarnya, atau apa pun yang sedang dievaluasi. Median tidak dapat menjelaskan rentang data yang bisa sangat besar dan dengan demikian dapat menyesatkan.

Tendensi sentral yang dievaluasi dengan modus semata-mata berarti melihat suatu bilangan yang paling sering muncul dalam suatu kumpulan data. Jadi peserta tes misalnya memiliki modus 100. Namun, ini tidak mencerminkan orang yang mengikuti tes gagal mengambil satu, yang menyesatkan.

Cara lain di mana statistik dapat menyesatkan adalah cara pertanyaan diajukan, mungkin dalam survei, dan sejauh mana survei tersebut merupakan sampel yang representatif dari suatu komunitas. Jika seseorang mensurvei sekelompok siswa sekolah menengah dan bertanya “Seberapa bahagia Anda dengan pendidikan Anda dalam skala 1-5?” seseorang mungkin mendapatkan jawaban yang sangat berbeda tergantung pada apakah kelompok tersebut mewakili siswa “rata-rata”.

Jika seseorang mensurvei sekelompok siswa yang semuanya mendapatkan nilai A dan bersekolah di sekolah yang fantastis dan didanai dengan baik, mempublikasikan data seperti itu sebagai sampel yang representatif adalah dengan sengaja menyesatkan. Jika seseorang bertanya kepada siswa dari sekolah yang berbeda dengan nilai yang berbeda, maka survei kemungkinan akan lebih representatif dan lebih adil. Namun, jika seseorang bertanya kepada siswa apa pendapat mereka tentang sekolah dan kemudian mempublikasikan hasilnya sebagai sampel yang mewakili populasi umum, jawabannya akan sangat miring.
Angka bisa tampak sangat konkret, dan beberapa disesatkan oleh angka hanya karena tampaknya fakta dan memiliki nilai yang tak terbantahkan. Jadi, data statistik seringkali dapat digunakan dengan cara yang menyesatkan untuk membuat orang kagum dengan angka-angka, dan membuat hal-hal yang diperdebatkan tampak lebih seperti fakta. Ahli statistik terkemuka tahu bahwa pertanyaan perlu digeneralisasi, dan juga perlu ditanyakan kepada orang-orang yang mewakili populasi.

Namun, angka dan statistik bisa menyesatkan karena tidak mewakili individu. Mereka mungkin menunjukkan bagaimana orang “secara umum” menanggapi sebuah ide, produk, atau kandidat politik. Mereka tidak dapat menunjukkan bagaimana perasaan satu orang dalam semua kualitas variabel tak terbatasnya.