Kan statistik vara vilseledande?

Det finns ett gammalt ordspråk att siffror inte ljuger, men lögnare vet hur man räknar. På sätt och vis representerar detta människors försiktighet mot statistik. Statistisk tolkning kan göra att data verkar vilseledande. Det beror på statistikerns tolkning av data och vilka siffror som lyfts fram som nyckelpunkterna i en statistisk rapport.
Till exempel i gymnasieskolan studerar eleverna nu mått på central tendens, som är medelvärde, median, läge och intervall. Medelvärdet är summan av all data, dividerad med antalet data. Till exempel kan man få summan av en persons testresultat och dividera den med antalet test för att bestämma ett betyg. Men medelvärdet kan påverkas av vad som kallas en extremvärde, ett tal långt utanför det normala testintervallet. Detta kan tyda på att medelvärdet kan vara ett missvisande sätt att bedöma prestanda.

Om en person tar fem tester perfekt och misslyckas med att ta ett sjätte test och därmed tjänar en nolla, återspeglar medelvärdet detta. Om till exempel alla tester är värda 100 poäng, är medelpoängen cirka 85 %. Detta tyder dock inte på genomsnittlig prestanda i det här fallet på grund av extremvärdet noll.

Ett annat mått på central tendens som kan användas är utvärdering av medianen. Medianen är det mellersta talet i en datagrupp ordnad numeriskt. Om en statistiker utvärderar för medianen kanske detta inte är representativt för ett verkligt medelvärde av prestanda, eller för vad som nu utvärderas. Medianen kan inte redogöra för ett dataintervall som kan vara enormt och därför kan vara missvisande.

Central tendens utvärderad av läge innebär bara att titta på ett tal som förekommer oftast i en uppsättning data. Så testtagaren har till exempel ett läge på 100. Detta återspeglar dock inte att personen som tog testet misslyckades med att ta ett, vilket är missvisande.

Andra sätt på vilka statistik kan vara vilseledande är sättet på vilka frågor ställs, i en undersökning kanske, och i vilken grad undersökningen är ett representativt urval av ett samhälle. Om man undersöker en grupp gymnasieelever och frågar ”Hur nöjd är du med din utbildning på en skala från 1-5?” man kan få väldigt olika svar beroende på om gruppen är representativ för den ”genomsnittliga” studenten.

Om man undersöker en grupp elever som alla blir raka As och går i en fantastisk, välfinansierad skola, är att publicera sådan data som ett representativt urval vara medvetet vilseledande. Om man frågar elever från olika skolor med olika betyg, så är en undersökning sannolikt mer representativ och mer rättvis. Men om man frågar eleverna vad de tycker om skolor och sedan publicerar resultaten som ett representativt urval av befolkningen i stort blir svaren mycket skeva.
Siffror kan verka väldigt konkreta, och vissa vilseleds av siffror bara för att de verkar vara fakta och har ett obestridligt värde. Således kan statistiska uppgifter ofta användas på ett missvisande sätt för att imponera på folk med siffror och få saker i tvisten att verka mer som fakta. Ansedda statistiker vet att frågor måste generaliseras, och måste också ställas till personer som representerar befolkningar.

Däremot kan siffror och statistik vara missvisande eftersom de inte representerar individen. De kan visa hur människor ”i allmänhet” reagerar på en idé, på en produkt eller på en politisk kandidat. De kan inte visa hur en enda person i alla hans eller hennes oändligt varierande egenskaper kommer att känna.