Vad är en varians?

Varians, som intervall, är en statistik relaterad till spridningen av ett givet urval eller population. Den beräknas för en given population genom att summera kvadraterna av skillnaden mellan varje element och genomsnittet, och sedan dividera den summan med antalet element i populationen. Ju tätare en population är samlad kring medelvärdet, desto lägre blir variansen.

En närbesläktad statistik är standardavvikelsen, som är kvadratroten av variansen. Standardavvikelsen används oftare i beskrivande statistik eftersom den är mer intuitiv och delar samma enheter som medelvärdet. I normalfördelningen, som är den klassiska klockformade fördelningskurvan som är gemensam för många fenomen, kommer lite mer än 95 procent av befolkningen att ligga inom två standardavvikelser från medelvärdet.

Varians är mest användbar för prediktiva statistiska tekniker som regression eller variansanalys (ANOVA). Regression kommer att modellera en variabel som summan av en eller flera faktorer som påverkar variabeln och variansen, vilket representerar skillnaden mellan de faktiska observerade elementen och deras förväntade värden. Till exempel kan byggnadssysselsättning i en stad modelleras som en basnivå, plus en säsongsjustering för tid på året, plus en justering för den nationella ekonomin, plus variansen. Regressionstekniker försöker bestämma en modell med den minsta variansen, så att det förväntade värdet av förutsägelsen förhoppningsvis kommer att vara nära det observerade värdet efter observation är möjlig.

ANOVA, som vanligtvis används i kliniska prövningar, är en statistisk teknik för att klassificera varianskällor. Observationer kategoriseras efter en eller flera faktorer av intresse i ett experiment. Minsta kvadrattekniker används för att dela upp variansen i slumpmässiga fel, faktoreffekter och interaktionseffekter, med målet att bestämma inflytandet som faktorn eller faktorerna har på variabeln. Till exempel kan ett företag som testar ett nytt gödselmedel använda ett ANOVA-experiment med skördeavkastning som den studerade variabeln och faktorer för vilket gödselmedel som användes och hur mycket nederbörd grödorna fick. Hur det nya gödselmedlet jämfört med andra gödselmedel skulle vara en faktoreffekt i försöket; om det nya gödselmedlet överträffade sina konkurrenter för standardregn men inte för kraftiga regn, skulle det vara ett exempel på en interaktionseffekt.