Vad är en Box Plot?

En boxplot eller box-and-whisker-diagram är en metod för att organisera numeriska data längs en enda tallinje, som kan vara antingen horisontell eller vertikal. Själva rutan, när plotten är horisontell, sitter något ovanför tallinjen och består av tre vertikala linjer, sammankopplade med horisontella linjer. Rutans horisontella gränser representerar den första och tredje kvartilen (25:e och 75:e percentilen), åtskilda av mittlinjen, som är datas median eller 50:e percentil. Plotta från mitten av de horisontella linjerna på vardera sidan av lådan sträcker sig vertikala linjer, ibland kallade morrhår. När dessa når minsta och maximala antal av datamängden slutar de i mindre horisontella linjer, även om detta kan variera något beroende på dataspridningen.

Det finns några viktiga element som utgör en bra boxplot, och några siffror som folk behöver veta när de skapar dessa diagram. Den första av dessa kallas femnummersammanfattningen, ofta förkortad som femtal. belopp. Detta är en lista över första och tredje kvartiler, median och minsta och maximala antal data. I vissa applikationer kommer människor att behöva lista dessa nära tomten, även om analys av en plot med en bra sifferlinje också kan härleda dessa siffror genom att titta på de tre horisontella linjerna och de avslutande morrhåren. Det är inte en kyckling/ägg-fråga för den som ritar en tomt eftersom de fem num. belopp. måste användas för att skapa tomten.

Människor behöver också känna till ett nummer som kallas interquartile range (IQR). Genom att subtrahera den första kvartilen från den tredje kvartilen härleds IQR, och med hjälp av annan programvara eller vetenskapliga miniräknare kan du också få detta nummer och femtalssammanfattningen genom att mata in all data. IQR är viktigt eftersom linjer som sträcker sig från rutan vanligtvis bara sträcker sig till 1.5 gånger IQR. Data bortom den punkten indikeras med punkter istället för en kontinuerlig linje. Dessa prickar tyder ofta på att data har extremvärden.

En mängd olika användningsområden finns för boxplotten. Flera diagram kan ritas ovanför en sifferlinje och kan jämföra liknande uppsättningar av data som differentieras av någon viktig faktor. Till exempel kan forskare eller statistiker registrera hjärtfrekvensen hos män och kvinnor och sedan konstruera två staplade kartonger för att leta efter signifikanta skillnader i räckvidd och kvartiler.

Boxplots adresserar inte datafrekvens. Avsaknaden av en extra skala (vertikal eller horisontell) utelämnar information om upprepade siffror, datamängdsstorlek och de flesta individuella siffror. Personen som tittar på en boxplot kommer bäst att förstå femtalssammanfattningen, intervallet och om data har några extremvärden. Boxstorlek, förhållandet mellan median och kvartiler och längden på morrhår kan visa om data är skev, men det kan inte tala om saker som medelvärde, läge eller standardavvikelse. Andra diagram som histogram kan vara mer användbara när människor vill representera saker som frekvens eller få bättre bilder om datadistribution.