Vad är variansanalys?

När man gör forskning blir det ibland nödvändigt att analysera data genom att jämföra mer än två prover eller grupper. En typ av inferentiell statistiktest, variansanalys (ANOVA), tillåter undersökning av flera prover samtidigt för att avgöra om det finns ett signifikant samband mellan dem. Resonemang är identiskt med t-test, endast variansanalys inkluderar oberoende variabler av två eller flera stickprov. Skillnader mellan prover såväl som skillnaden inom ett prov bestäms. ANOVA baseras på fyra antaganden: mätningsnivån, urvalsmetoden, populationens fördelning och variansens homogenitet.

För att avgöra om skillnader är signifikanta, är ANOVA oroad över skillnader mellan och inom proverna, vilket kallas variansen. ANOVA kan ta reda på om variansen är större mellan proven jämfört med den bland provmedlemmarna. Om detta visar sig vara sant, anses skillnaderna vara betydande.

Att genomföra ett ANOVA-test innebär att vissa antaganden accepteras. Den första är att den oberoende slumpmässiga urvalsmetoden används och valet av urvalsmedlemmar från en enda population påverkar inte valet av medlemmar från senare populationer. Beroende variabler mäts primärt på intervall-kvotsnivån; det är dock möjligt att tillämpa variansanalysen på mätningar på ordinalnivå. Man kan anta att populationen är normalfördelad, även om detta inte är verifierbart, och populationsvariationerna är desamma, vilket gör att populationerna är homogena.

Forskningshypotesen antar att åtminstone ett medelvärde skiljer sig från de andra, men de olika medelvärdena identifieras inte som större eller mindre. Endast det faktum att det finns en skillnad förutsägs. ANOVA testar för nollhypotesen, vilket innebär att det inte finns någon skillnad mellan alla medelvärden, så att A = B = C. Detta kräver att alfa ställs in med hänvisning till sannolikhetsnivån där nollhypotesen kommer att förkastas.

F-ratio är en teststatistik som används specifikt för variansanalys, eftersom F-poängen visar var området för avslag för nollhypotesen börjar. Formeln för F har utvecklats av statistikern Ronald Fisher och är följande: F = mellan gruppvariansuppskattning (MSB) dividerat med inom gruppens variansuppskattning (MSW), så att F = MSB/MSW. Var och en av variansskattningarna består av två delar — summan av kvadrater (SSB och SSW) och frihetsgrader (df). Med hjälp av de statistiska tabellerna för biologisk, jordbruks- och medicinsk forskning kan alfa ställas in och baseras på detta, och nollhypotesen om ingen skillnad kan förkastas. Man kan dra slutsatsen att det finns en betydande skillnad mellan alla grupperna, om så är fallet.