Vilka är de olika dataanalysteknikerna?

Dataanalystekniker tillåter forskare att granska insamlad data och dra slutsatser eller beslutsamhet från informationen. De flesta tekniker fokuserar på tillämpningen av kvantitativa tekniker för att granska data. Några av de mer populära teknikerna för kvantitativ dataanalys inkluderar beskrivande statistik, explorativ dataanalys och bekräftande dataanalys. De två sistnämnda involverar användningen av att stödja eller inte stödja en förutbestämd hypotes. Grupper som kan använda dessa tekniker inkluderar enskilda forskare, studenter, företag, statliga myndigheter och aktuarier, bland andra parter som behöver information och data.

Kvantitativ dataanalys försöker ta bort forskarbias från insamlad data. Tung användning av statistik, sannolikheter eller andra matematiska tekniker tillåter individer att använda standardmetoder för att tolka data. När forskare försöker använda kvalitativa dataanalystekniker – ofta baserade på individens personliga bakgrund, preferenser eller grundläggande forsknings- och resonemangsprinciper – kan den insamlade informationen bli felläst eller felaktigt tolkad. Därför är matematiska tekniker mindre mottagliga för dessa fel och ofta mer accepterade av andra individer eller forskare.

Beskrivande statistisk analys separerar eller sammanfattar data i specifika grupper. Demografi är en vanlig uppsättning beskrivande statistik. Forskare kommer att samla information om en befolknings ålder, kön, hushållsstorlek, inkomst, typ av arbete och annan information. En annan typ av beskrivande statistisk analys är slutförandeprocenten för en quarterback när han spelar i en fotbollsmatch. Om quarterbacken slutför sex av åtta passningsförsök har han en fullbordandeprocent på 75 procent. En brist i denna teknik är oförmågan för statistiken att ge ytterligare information, såsom längden på varje pass.

Undersökande dataanalystekniker involverar ofta användningen av boxplots, histogram, Pareto-diagram, spridningsdiagram eller en stam-och-blad-plot. Huvudsyftet med denna teknik är att stödja en uttalad hypotes från en forskare. Till exempel kan en forskare vilja bevisa en hypotes om åldersintervallet för ägare som kör en viss typ av bil, till exempel en minivan. För att testa och stödja denna hypotes kommer forskaren att samla information och skapa en boxplot för att fastställa antalet ägare inom hans angivna intervall. Statistiken kommer att ge information som stöder eller inte stöder hypotesen och visar hur många extremvärden som finns i den insamlade informationen.

Bekräftande dataanalystekniker är motsatsen till utforskande tekniker. I dessa tester försöker forskaren motbevisa nollhypotesen, vilket är ett påstående som allmänt accepteras som sant av de flesta individer. För att motbevisa nollhypotesen kommer forskaren att samla in specifik information relaterad till hypotesen och testa medelvärdet, variansen, p-värdena och konfidensintervallen. Det konfidensintervall som bevisas av den bekräftande dataanalysen kommer att ge information om hur säker forskaren ska vara på om nollhypotesen är sann eller falsk.