Vad är Fishers Exact Test?

Fishers exakta test är ett statistiskt signifikanstest som används för små urvalsstorlekar. Det är ett av ett antal test som används för att analysera beredskapstabeller, som visar interaktionen mellan två eller flera variabler. Detta test uppfanns av den engelske forskaren Ronald Fisher, och det kallas exakt eftersom det beräknar statistisk signifikans exakt, snarare än genom att använda en approximation.

För att förstå hur Fishers exakta test fungerar är det viktigt att förstå vad en beredskapstabell är och hur den används. I det enklaste exemplet finns det bara två variabler som ska jämföras i en beredskapstabell. Vanligtvis är dessa kategoriska variabler. Som ett exempel, föreställ dig att du genomför en studie om huruvida kön korrelerar med att äga husdjur. Det finns två kategoriska variabler i denna studie: kön, antingen man eller kvinna, och husdjursägande.

En beredskapstabell sätts upp med en variabel på toppen och den andra på vänster sida, så att det finns en ruta för varje kombination av variabler. Summorna anges längst ned och längst till höger. Så här skulle en beredskapstabell se ut för exempelstudien, om man antar en undersökning av 24 individer:

Husdjursägare
Inte en husdjursägare
Totalt
man
1
9
10
Kvinna
11
3
14
Totalt
12
12
24

Fishers exakta test beräknar avvikelsen från nollhypotesen, som säger att det inte finns någon bias i data, eller att de två kategoriska variablerna inte har någon korrelation med varandra. I fallet med det aktuella exemplet är nollhypotesen att män och kvinnor är lika benägna att äga husdjur. Fishers exakta test utformades för beredskapstabeller med en liten provstorlek eller stora avvikelser mellan cellnummer, som den som visas ovan. För beredskapstabeller med en stor urvalsstorlek och välbalanserade siffror i varje cell i tabellen är Fishers exakta test inte korrekt, och chi-kvadrattestet är att föredra.

Vid analys av data i tabellen ovan tjänar Fishers exakta test till att bestämma sannolikheten för att husdjursägandet är ojämnt fördelat mellan män och kvinnor i urvalet. Vi vet att tio av de 24 tillfrågade har husdjur och att 12 av de 24 är kvinnor. Sannolikheten att tio personer som väljs slumpmässigt ur urvalet kommer att bestå av nio kvinnor och en man kommer att antyda den statistiska signifikansen av fördelningen av djurägare i urvalet.

Sannolikhet betecknas med bokstaven p. Fishers exakta test bestämmer p-värdet för ovanstående data genom att multiplicera faktorerna för varje marginalsumma — i tabellen ovan, 10, 14, 12 och 12 — och dividera resultatet med produkten av faktorerna för varje cellnummer och av totalsumman. En faktoriell är produkten av alla positiva heltal mindre än eller lika med ett givet tal. 10!, uttalas ”tio factorial”, är därför lika med 10X9X8X7X6X5X4X3X2X1, eller 3,628,800 XNUMX XNUMX.
För tabellen ovan, då, p= (10!)(14!)(12!)(12!)/(1!)(9!)(11!)(3!)(24!). Med hjälp av en miniräknare kan man fastställa att sannolikheten för att få siffrorna i tabellen ovan är under 2 %, långt under chansen, om nollhypotesen är sann. Därför är det mycket osannolikt att det inte finns någon oförutsedd, eller signifikant samband, mellan kön och husdjursägande i studieurvalet.