Vad är Bayes sats?

Bayes sats, ibland kallad Bayes regel eller principen om invers sannolikhet, är en matematisk sats som följer mycket snabbt av sannolikhetsteorins axiom. I praktiken används den för att beräkna den uppdaterade sannolikheten för något målfenomen eller hypotes H givet ny empirisk data X och viss bakgrundsinformation, eller tidigare sannolikhet.

Den tidigare sannolikheten för en hypotes representeras vanligtvis av någon procentsats mellan 0 % och 100 %, eller något tal mellan 0 och 1. Denna sannolikhet kallas ofta grad av konfidens, och är tänkt att variera från observatör till observatör, eftersom inte alla observatörer har haft samma erfarenhet och kan därför inte göra likvärdiga sannolikhetsuppskattningar för en given hypotes. Tillämpningen av Bayes teorem i ett vetenskapligt sammanhang kallas Bayesian inferens, vilket är en kvantitativ formalisering av den vetenskapliga metoden. Det möjliggör en optimal revidering av teoretiska sannolikhetsfördelningar givet experimentella resultat.

Bayes teorem i samband med vetenskaplig slutledning säger följande: ”Den nya sannolikheten för att någon hypotes H är sann (kallad posterior sannolikhet) givet nya bevis X är lika med sannolikheten att vi skulle observera detta bevis X givet att H faktiskt är sant (kallad betingad sannolikhet, eller sannolikhet), gånger den tidigare sannolikheten för att H är sant, allt dividerat med sannolikheten för X.”

En vanlig omformulering av ovanstående när det gäller hur ett testresultat bidrar till sannolikheten att en given patient har cancer kan visas som följande:
p(positiv|cancer)*p(cancer)
_______________________________________________
p(positiv|cancer)*p(cancer) + p(positiv|~cancer)*p(~cancer)
Den vertikala stapeln betyder ”given”. Sannolikheten för att patienten har cancer efter ett positivt resultat på ett visst cancertest är likvärdigt med sannolikheten för ett positivt resultat givet cancer (som härrör från tidigare resultat) gånger tidigare sannolikhet för en given person att ha cancer (relativt låg) alla dividerat med det samma antal, plus sannolikheten för ett falskt positivt gånger den tidigare sannolikheten att inte ha cancer.

Det låter komplicerat, men ovanstående ekvation kan användas för att bestämma den uppdaterade sannolikheten för varje hypotes givet ett kvantifierbart experimentellt resultat.