Frekvensfordeling | en liste over de værdier, som en variabel har i en stikprøve
I statistik er en frekvensfordeling en liste over de værdier, som en variabel har i en stikprøve. Det er normalt en liste, der er ordnet efter mængde. Den viser antallet af gange, hver værdi forekommer. Hvis 100 personer f.eks. vurderer deres enighed med et udsagn på en fempunkts Likert-skala, hvor 1 angiver stærk enighed og 5 stærk uenighed, kan frekvensfordelingen af deres svar f.eks. se således ud
Denne enkle tabel har to ulemper. Når en variabel kan antage kontinuerte værdier i stedet for diskrete værdier, eller når antallet af mulige værdier er for stort, er det vanskeligt, hvis det ikke er umuligt, at konstruere tabellen. I sådanne tilfælde anvendes et lidt andet skema baseret på værdispektret. Hvis vi f.eks. betragter højden af eleverne i en klasse, kan hyppighedstabellen se ud som nedenfor.
Dette er Kinas befolkningspyramide for år 2005.
Eksempel på en (absolut) frekvensfordeling. Dette er befolkningspyramiden for Angola for 2005.
Applikationer
Det er meget nemmere at administrere og arbejde med frekvenstabellerede data end at arbejde med rå data. Der findes enkle algoritmer til at beregne median, middelværdi (statistik), standardafvigelse osv. fra disse tabeller.
Statistisk hypotesetestning er baseret på vurderingen af forskelle og ligheder mellem frekvensfordelinger. Denne vurdering omfatter mål for central tendens eller gennemsnit, f.eks. middelværdi og median, og mål for variabilitet eller statistisk spredning, f.eks. standardafvigelse eller varians.
En frekvensfordeling siges at være skæv, når dens gennemsnit og median er forskellige. En frekvensfordelings kurtose er koncentrationen af scoringer ved middelværdien, eller hvor stor en spids fordelingen er, hvis den afbildes grafisk - f.eks. i et histogram. Hvis fordelingen er mere toppet end normalfordelingen, siges den at være leptokurtisk; hvis den er mindre toppet, siges den at være platykurtisk.
Frekvensfordelinger bruges også i frekvensanalyser til at knække koder og henviser til den relative hyppighed af bogstaver i forskellige sprog.
| ||||||||||||||||||||||||
| ||||||||||||||||||||||||
| ||||||||||||||||||||||||
| ||||||||||||||||||||||||
| ||||||||||||||||||||||||
|
| ||||||||||||||||||||||||
|
Spørgsmål og svar
Spørgsmål: Hvad er en frekvensfordeling?
A: En frekvensfordeling er en liste over de værdier, som en variabel antager i en stikprøve, ordnet efter mængde. Den viser, hvor mange gange hver værdi forekommer.
Spørgsmål: Hvordan kan frekvensfordelingen af svarene på en fempunkts Likert-skala se ud?
Svar: Frekvensfordelingen af svarene på en fempunkts Likert-skala kan ligne en simpel tabel, der viser antallet af personer, der har vurderet hvert punkt på skalaen.
Sp: Hvad er to ulemper ved at bruge denne type tabel?
A: To ulemper ved at bruge denne type tabel er, at det kan være vanskeligt eller endog umuligt at bruge den, når der er tale om kontinuerte værdier, eller når der er for mange mulige værdier.
Spørgsmål: Hvordan er denne ordning anderledes, når der er tale om kontinuerlige værdier eller et stort antal mulige værdier?
Svar: Når der er tale om kontinuerlige værdier eller et stort antal mulige værdier, kan der i stedet anvendes en lidt anderledes ordning baseret på værdispænd.
Spørgsmål: Hvordan kan en hyppighedstabel for elevernes højde se ud?
Svar: Hyppighedstabellen for elevhøjder kan vise intervaller, og hvor mange elever der falder inden for hvert interval.
Spørgsmål: Hvilke oplysninger giver frekvensfordelingen?
Svar: Frekvensfordelingen giver oplysninger om, hvor ofte visse variabler forekommer i stikprøver, og hvordan de er fordelt på tværs af disse stikprøver.