Vad är ett histogram?

Inom statistik är ett histogram en typ av graf som visar fördelningen av frekvenser av data, vanligtvis i form av vertikala staplar. Denna typ av graf kallas också vanligtvis ett frekvenshistogram, och ibland ett stapeldiagram eller stapeldiagram. I ett histogramdiagram visar höjden på varje stapel antalet objekt som faller inom det intervallet på grafen. Histogramfördelningsgrafer anses ofta vara det viktigaste verktyget för att studera distributionen av data.

Histogramdiagrammet visas i allmänhet med frekvensen av datavärdena på grafens vertikala Y-axel och de olika typerna eller kategorierna av data längs grafens horisontella X-axel. Förutom att visa hur ofta ett visst värde förekommer i en uppsättning data, kan en del annan information samlas in med hjälp av statistisk analys av histogramdata. Detta inkluderar ”formen” på data, till exempel en ”plat” fördelning eller en ”klockformad” fördelning.

En Pareto-graf är en speciell typ av histogram där staplarna är ordnade efter storlek, där den högsta stapeln visas längst till vänster i grafen och den minsta till höger. Dessa Pareto-grafer används ofta i kvalitetskontrollprojekt för att belysa de vanligaste produktdefekterna i tillverkningssystem. De får sitt namn från ”Pareto-principen”, som säger att 20 % av insatsvarorna i tillverkningsprocessen kommer att orsaka 80 % av defekterna.

Några exempel på mönster som kan detekteras i histogram inkluderar enkla toppmönster och dubbla toppmönster. En enda topp i data är också det statistiska medelvärdet för data. När det statistiska medelvärdet inte är i mitten av grafen kan det tyda på en speciell anledning som kan vara bra att undersöka.

Ett dubbelt toppmönster uppstår där det finns två mycket höga staplar på grafen. När detta mönster ses kan det tyda på att det finns två distinkta datakällor. Till exempel i en produktionslinje kan topparna hänföras till två enskilda operatörer.

Histogramutjämning är en metod som används vid bildmanipulering, till exempel programvara för digital fotografering. Den använder histogram för att räkna ut vilka intensitetsnivåer i bilden som är vanligast, och distribuerar sedan dessa mer effektivt. På så sätt kan bildens övergripande kontrast förbättras för bättre visning.