Ett icke-parametriskt test är en typ av statistisk hypotestestning som inte antar en normalfördelning. Av denna anledning kallas icke-parametriska test ibland som distributionsfria. Ett icke-parametriskt test är mer robust än ett standardtest, kräver i allmänhet mindre prover, är mindre sannolikt att påverkas av utanförliggande observationer och kan tillämpas med färre antaganden. Å andra sidan kan icke-parametriska test vara mindre effektiva än sina standardmotsvarigheter, särskilt om befolkningen verkligen är normalfördelad. Icke-parametrisk testning är särskilt effektiv för frågor som handlar om frekvenser och proportioner.
Standardhypotestestning jämför ett urval från en testpopulation med ett urval från en kontrollpopulation för att avgöra om testpopulationen är statistiskt jämförbar med kontrollpopulationen. Om skillnaden mellan urvalsparametern eller parametrarna – vanligtvis medelvärdet och/eller variansen – är tillräckligt stor, kan testprovet bedömas vara skilt från kontrollpopulationen. Sådan parametrisk testning kräver att parametrarna kommer från en normalfördelning.
Det har matematiskt bevisats att en urvalsstorlek på 30 eller mer kommer att bete sig ungefär som en normalfördelning, så detta krav antas generellt. Om antagandet inte är motiverat kan det hända att resultaten av testningen inte är giltiga. Icke-parametrisk testning undviker detta antagande.
Istället undersöker icke-parametrisk hypotestestning vanligtvis data antingen genom att kategorisera dem eller genom att beställa dem. Om urvalet och kontrollpopulationerna är desamma och om uppgifterna har samlats in korrekt, är eventuella skillnader mellan deras kategorier eller rankningar enbart ett resultat av slumpen. Om sannolikheten för att dessa skillnader kunde ha inträffat av en slump, även kallad ett P-värde, är mindre än en vald signifikant sannolikhet, vanligtvis antingen 5 procent eller 1 procent, så förkastar testaren hypotesen att urvalet och kontrollpopulationerna är samma och drar slutsatsen att de är olika.
Ett vanligt icke-parametriskt test är ett chi-kvadrattest, som används för att jämföra observerade frekvenser eller proportioner. När endast en uppsättning frekvenser undersöks kallas detta ofta för ett passningstest och används för att avgöra om de observerade frekvenserna passar inom det förväntade intervallet. Till exempel kan ett passformstest användas för att avgöra om ett roulettebord har riggats genom att jämföra tabellresultaten med de resultat som sannolikhetsteorin förutspår eller för att avgöra om en huvudvärksmedicin var effektiv genom att jämföra andelen personer vars huvudvärk förbättrats på medicinen till andelen personer vars huvudvärk förbättrades när de tog placebo. Om två frekvenser undersöks kan Chi-kvadratens icke-parametriska test användas för att testa för korrelation eller oberoende mellan faktorer. Politiska opinionsundersökningar letar ofta efter samband mellan sociala, ekonomiska eller demografiska faktorer och politiska övertygelser, som att se om det finns ett samband mellan en persons utbildning och om han eller hon godkänner hur en förtroendevald presterar.
Ett annat icke-parametriskt test är Wilcoxon ranksummetest, som vanligtvis används i samma situationer som standardparametrisk hypotestestning. Istället för att undersöka medelvärdet för varje prov, undersöker Wilcoxon-testet emellertid rangordningen för varje värde om de två proverna är ordnade från minst till störst. Om de två proverna är lika, bör varje grupp vara jämnt utspridda genom rankningen. Om en grupp är klustrad i den nedre eller övre delen av rankningen, indikerar detta att de två grupperna är olika.
Anta till exempel att någon ville avgöra om animerade filmer är längre eller kortare än icke-animerade filmer. För ett standardtest skulle han eller hon bestämma den genomsnittliga varaktigheten för ett urval av animerade filmer och för ett urval av live-action-filmer och jämföra skillnaden med variansen av proverna. För Wilcoxons icke-parametriska test ordnas filmtiderna från minsta till störst, och de animerade filmtiderna summeras.
Personen skulle kunna beräkna sannolikheten för att rangsumman skulle vara den storleken eller mindre genom att bestämma antalet möjliga beställningar med en given rangsumma och det totala antalet möjliga beställningar, en beräkning som är enkel med tanke på tillräckligt med råkraftsberäkningsstyrka. Med två små prov på sex filmer vardera finns det redan 924 möjliga rankningsarrangemang, ett antal som snabbt växer sig mycket större när filmer läggs till. Alternativt finns publicerade tabeller som ger sannolikheter motsvarande givna rangsummor för givna urvalsstorlekar. Dessa finns i statistiktexter eller på nätet.
Icke-parametrisk testning är ett växande område. Den kan tillämpas inom alla områden där mer konventionell statistik också har använts. Tillämpningar är särskilt vanliga inom samhällsvetenskap och medicin, dock särskilt när normalfördelning inte kan tillämpas.