Vad är konfidensintervall?

I statistiken används konfidensintervall som intervalluppskattningar för populationsparametrar. De används ofta inom vetenskap och teknik för hypotestestning, statistisk processkontroll och dataanalys. Även om det är möjligt att beräkna konfidensintervall för hand, är det vanligtvis enklare och mycket snabbare att använda specialiserade statistikprogram eller avancerade grafräknare.

Om en sannolikhetssats av formen P(L≤θ≤U) = 1 – α kan skrivas så att L och U uteslutande är funktioner av provdata och θ är en parameter, då är intervallet mellan L och U en konfidens intervall. Denna definition kan uttryckas på ett mer intuitivt och praktiskt sätt genom att säga att ett påstående om att parametern θ ligger i konfidensintervallet kommer att vara sant 100(1 – α)% av de gånger påståendet görs. Termen (1 – α) är känd som konfidenskoefficienten.

För fallet med en normalfördelad population med känt medelvärde μ och känd varians σ2, kan 100(1 – α) konfidensintervallet runt medelvärdet beräknas med ekvationen x – zα/2σ/√n ≤ μ ≤ x + zα/ 2σ/√n, där zα/2 är de övre 100α/2 procentenheterna av standardnormalfördelningskurvan. Detta är ett enkelt fall, eftersom det sanna medelvärdet och variansen för hela befolkningen vanligtvis inte är kända.

Konfidensintervall används oftast för att bestämma hur väl en viss parameter passar in i en given datamängd. Till exempel, om konfidensintervallet för en given datamängd sträcker sig från 45 till 55 med en konfidenskoefficient på 0.95, skulle man kunna hävda att vilken datapunkt som helst som faller inom denna region hör hemma i befolkningen med 95 procents konfidens. Att öka konfidensfaktorn stramar intervallet, vilket innebär att ett mindre intervall av variabler kan förklaras med större tillförsikt. Att minska konfidensfaktorn breddar intervallet men minskar konfidensen.

För vissa tillämpningar, såsom normalfördelade populationer med kända medelvärden och varianser, är ekvationerna som används för att beräkna konfidensintervall lätt tillgängliga. Statistiktabeller kan användas för att hitta värden för zα/2. Andra tillämpningar, såsom dataanalys inom teknik, kräver mer sofistikerade beräkningsmetoder. Det är vanligtvis mer praktiskt att använda ett statistikprogram för att fastställa konfidensintervall för dessa fall. Statistikprogram kan vara särskilt användbara när datamängderna är extremt stora och resultaten måste presenteras grafiskt.