Vad är normal sannolikhetsfördelning?

Statistikens principer säger att det, givet en tillräcklig urvalsstorlek, är möjligt att förutsäga den normala sannolikhetsfördelningen för en större population. De flesta människor associerar fördelningssannolikhet med formen som uppstår när data plottas, vilket kommer att bilda en klockkurva. Normalkurvan kommer att visa en högre koncentration nära medelvärdet, eller den punkt där hälften av provet ligger på vardera sidan. Det finns färre element i provet när man rör sig bort från medelpunkten.

Det är lätt att föreställa sig klockkurvan som representerar den normala sannolikhetsfördelningen om man föreställer sig vad som händer när mjöl siktas på en tallrik. Det mesta av mjölet hamnar i en hög direkt under sikten. När man rör sig bort från toppen av högen blir mjölet mindre djupt, och vid kanten av tallriken kan lite eller inget mjöl hittas.

För att kvantifiera hur provet, såsom mjölet, är dispergerat, är det nödvändigt att förklara standardavvikelser. I enklaste termer indikerar standardavvikelsen hur spridd varje databit är från andra datapunkter och medelvärdet. Om punkterna är klustrade tätt samman blir standardavvikelsen mindre än om de är vitt spridda. Till exempel, om medeltemperaturen i en stad varierar dramatiskt efter säsong, kommer den att ha en större standardavvikelse än den normala sannolikhetsfördelningen för en stad på ekvatorn där temperaturen förblir relativt konstant hela året.

Som ett exempel, tänk på att i USA är 27.8 procent av damskorna som säljs i storlekarna 8 och 8.5, 23.7 procent är storlekarna 7 och 7.5 och 17.5 procent är storlekarna 9 eller 9.5. Baserat på denna information har skotillverkare fastställt den genomsnittliga skostorleken till 8 till 8.5; att använda 27.8 som medelvärde och att tilldela en standardavvikelse på en skostorlek bör bevisa att cirka 68 procent av alla kvinnor bär mellan en 7 och en 9.5 sko. Att lägga till siffrorna ger 69 procent, väl inom den normala sannolikhetsfördelningen.

Om man rör sig utåt från medelvärdet bör siffrorna indikera att cirka 99 procent bär mellan en storlek 5 och en storlek 11. Med tanke på tillverkarnas rapporter om att 4.8 procent av all försäljning är en storlek 5 eller 5.5, 11.7 procent är en storlek 6 eller 6.5, 10 procent är en storlek 10 eller 10.5 och 3 procent är en storlek 11, man kan se att 98.5 procent av all försäljning följer principen om normal sannolikhetsfördelning. Endast 1.5 procent av alla sålda skor faller över tre standardavvikelser av medelvärdet.

Principerna för normal sannolikhetsfördelning används för många olika tillämpningar. Enkätare använder ibland distributionssannolikhet för att förutsäga riktigheten av de data de samlar in. Normalkurvan kan också användas i finansiella tillämpningar, såsom för att analysera en viss akties prestanda. Lärare kan tillämpa lagarna för normal sannolikhetsfördelning för att förutsäga framtida testresultat eller för att betygsätta uppsatser på en kurva.