Vad är skillnaden mellan median och medelvärde?

I statistik är medelvärde och median olika mått på den centrala tendensen i en datauppsättning, eller tendensen hos siffrorna att samlas kring ett visst värde. I en grupp av värderingar kan det vara önskvärt att hitta den som är mest typisk. Ett sätt att göra detta är att hitta medelvärdet, eller medelvärdet, som är summan av alla värden dividerat med det totala antalet värden. Ett annat sätt är att hitta medianvärdet, eller mittvärdet, som är det i mitten av en ordnad lista med tal. Den bättre metoden att använda beror på applikationen och på vilken typ av data.

Betyda

Att få medelvärdet av något är detsamma som att få medeltalet i en datamängd. Summan av värdena i uppsättningen delas med antalet värden. Till exempel kan en lärare utvärdera fem testresultat, alla lika viktade, för att bestämma ett betyg för en elev. Om de fem provresultaten är 80, 85, 60, 90 och 100, adderas dessa siffror för att ge summan 415, som divideras med 5 för att få medelpoängen 83. Efter att ha beräknat detta kan läraren tilldela ett betyg till eleven.

median
I en medianmätning är uppgifterna ordnade från lägsta till högsta: 60, 80, 85, 90 och 100. Mellantalet i denna uppsättning är medianen. I det här exemplet är medianen 85, det tredje och mellersta numret på uppsättningen. Detta varierar något från medelvärdet på 83. En lärare kanske vill titta på ett medianpoäng, eftersom det tenderar att utesluta ett ovanligt lågt betyg, som 60, som skulle sänka genomsnittet.

Där antalet värden är jämnt tas ett medelvärde av de två centrala talen. Dessa två tal läggs ihop och divideras med två. Till exempel, i en klass med tio elever kan poängen i ett test vara, i stigande ordning, 48, 56, 57, 61, 65, 68, 68, 71, 77 och 82. Medianen för denna datamängd skulle vara genomsnittet av de femte och sjätte talen, 65 och 68, vilket är 66.5.

Tillämpningar
Dessa metoder används båda för att hitta ett ”typiskt” värde från en uppsättning data. Medelvärdet är det vanligaste måttet på central tendens, men det finns fall där det inte är lämpligt. Till exempel kan uppgifterna vara ”skeva”, vilket betyder att de flesta av siffrorna är mot antingen den låga eller höga delen av skalan, eller att det finns ett värde som skiljer sig mycket från alla andra – detta är känt som en uteliggare. Särskilt i en liten uppsättning data kommer medelvärdet i dessa fall inte att vara typiskt.

Till exempel, om fem elever gör ett prov, och poängen är 24, 85, 89, 91 och 95, är medelpoängen 60.6. Detta är dock otypiskt – snittet har dragits ner med en ytterst 24 poäng, möjligen för att en student inte hade studerat. I det här fallet är medianen på 89 mycket mer typiskt.
En annan metod som ibland används är läget, som helt enkelt är det vanligaste värdet i en datamängd. Det används ibland där de möjliga värdena i en uppsättning data är begränsade och utesluter varandra. Till exempel kan en undersökning bland ägare av bärbara datorer genomföras för att hitta det populäraste varumärket. I det här fallet skulle ett medel- eller medianvarumärke inte vara vettigt, och det mest populära märket skulle vara läget.

För att ge ett exempel där alla tre metoderna kan användas, kan vissa uppgifter om anställda i ett företag samlas in. En analys kan beräkna den genomsnittliga lönen, men denna kan vara skev av ett litet antal mycket höginkomsttagare i ledningen, så medianlönen kan ge en bättre uppfattning om hur mycket en typisk anställd får betalt. Om uppgifterna är uppdelade efter utbildningskvalifikationer kan det visa sig att majoriteten av de anställda har en universitetsexamen — detta skulle vara läget.

Vad är det aritmetiska medelvärdet?

Vad är standardavvikelse?

Vilka är de bästa tipsen för att beräkna standardavvikelse?

Vad är förväntningsvärde?

Vad är standardavvikelsepercentiler?

Vad är en svansrisk?