Vilka är de olika typerna av histogramtolkning?

Det finns många olika typer av histogramtolkning, bestämt av grafens övergripande form. De två huvudsakliga distinktionerna är symmetriska histogram och asymmetriska histogram. Inom dessa två stora distinktioner finns ett antal andra distinktioner, beroende på fördelningarna av grafen. Att förstå de olika typerna av histogramtolkning kan låta analytiker veta något om data vid första anblicken.

Den normala formen på ett histogram kallas klockformen eller klockkurvan. Det högsta antalet datapunkter finns nära mitten av grafen, med allt lägre antal punkter i varje ände som rör sig bort från mitten. När en linje ritas, ungefär med toppen av staplarna som referenspunkter, liknar den formen av en klocka. Detta är det mönster som uppstår oftast när man analyserar saker som sker i den naturliga världen.

Två typiska varianter av den symmetriska histogramtolkningen är den icke-normala kortstjärtade och den icke-normala långsvansade. I dessa fall tenderar datapunkterna fortfarande att vara mestadels jämna på båda sidor, men det finns en viss skillnad i fördelningen. I en kortstjärtad histogramtolkning tenderar datapunkterna att samlas runt mitten. I en långsvansad tolkning tenderar datapunkterna att vara mer utspridda, men fortfarande mestadels jämnt fördelade på båda sidor.

En annan variant av det symmetriska histogrammet är symmetriskt med extremvärden. I det här fallet kan det finnas betydande luckor inom datamängderna som lämnar luckor i histogrammet. Trots det förblir histogrammet relativt symmetriskt eftersom extremvärdena visas på båda sidor. I vissa fall kan extremvärden kastas ut eftersom de inte är statistiskt signifikanta.

Den andra huvudtypen av tolkning för histogram är den asymmetriska tolkningen. Liksom den andra stora divisionen kan asymmetriska histogram ytterligare delas upp i underavdelningar. Asymmetriska histogram är också kända som skeva histogram, eftersom datapunkterna gynnar ena sidan av mitten eller den andra sidan. Outliers kan också finnas i skeva histogram, men påverkar vanligtvis inte formen eller medelvärdena, såvida de inte är extrema extrema extremvärden.

En skev eller asymmetrisk histogramtolkning är ofta svår att verkligen åstadkomma eftersom datapunkterna är starkt gynnade åt den ena eller andra sidan. Ofta kan medelvärden betyda väldigt lite i sådana datamängder eftersom de är så skeva. Genomsnittet är kanske inte riktigt i mitten av histogrammet, och detta tenderar att minska dess statistiska signifikans.