Vad är histogramklasser?

Histogramklasser är värdeintervall som innehåller datapunkter i en frekvensfördelning eller tabulering av rådata. De kallas också för intervaller, lådor eller lådbredder. I ett histogram, en typ av stapeldiagram, visas dessa klasser som vertikala kolumner där höjden på kolumnen indikerar antalet datapunkter som finns i klassintervallet. Vanligtvis görs valet av histogramklass för att förbättra den visuella representationen av datastatistik eller trender.

När det finns en stor mängd data att visa är ett histogram särskilt användbart för att avbilda formen på dess distribution. En hel rad data bryts ner i intervall och antalet datapunkter som faller in i varje räknas för att ge klassens frekvens. Intervallets intervall eller bredd bestämmer antalet histogramklasser och påverkar grafens form.

Om intervallet är för brett kan betydande information utelämnas genom att klasserna är för inkluderande. När valet av intervallbredd är för snävt kan låg klassfrekvens ge onödig betydelse för vad som faktiskt är en slumpmässig variation. Det finns flera metoder för att ställa in ett lämpligt antal histogramklasser för en datamängd.

Enligt Sturgis regel ska antalet klasser vara nära bas 2-loggen för antalet datapunkter plus en. Med hjälp av Rice’s regel bör antalet definierade klasser vara två gånger kubikroten av antalet datapunkter. Oavsett vilken metod som används för att välja antalet histogramklasser, bör flera olika bredder testas för att testa känsligheten hos histogramformen för klassstorlek. Det korrekta antalet klasser är den som mest exakt visar fördelningen av data.

Med rätt antal histogramklasser för en rad data bör en meningsfull grafisk representation resultera som möjliggör tydlig tolkning. Ett histogram bör visa centrum och spridning av data, eventuell skevhet eller dataasymmetri och extremvärden eller datapunkter som förekommer utanför det förväntade värdeintervallet. Läget, eller det vanligast förekommande värdet, bör vara tydligt liksom grupperingar som kan indikera en multipel modalitet. Histogramanalys kan också indikera fel i datainsamlingsprocessen.

Histogram har länge använts inom finans och samhällsvetenskap och har blivit mer bekanta i de grafiska displayerna för hemelektronik. Digital fotografering är särskilt öppen för deras användning, med många kameror som har ett färghistogram för att indikera vitbalans och exponering. Ett histogram för digital fotografering kan också visa pixlar som histogramklasser plottade mot gråtoner.