Frekvensfordeling | en liste over de værdier, som en variabel har i en stikprøve

I statistik er en frekvensfordeling en liste over de værdier, som en variabel har i en stikprøve. Det er normalt en liste, der er ordnet efter mængde. Den viser antallet af gange, hver værdi forekommer. Hvis 100 personer f.eks. vurderer deres enighed med et udsagn på en fempunkts Likert-skala, hvor 1 angiver stærk enighed og 5 stærk uenighed, kan frekvensfordelingen af deres svar f.eks. se således ud

Denne enkle tabel har to ulemper. Når en variabel kan antage kontinuerte værdier i stedet for diskrete værdier, eller når antallet af mulige værdier er for stort, er det vanskeligt, hvis det ikke er umuligt, at konstruere tabellen. I sådanne tilfælde anvendes et lidt andet skema baseret på værdispektret. Hvis vi f.eks. betragter højden af eleverne i en klasse, kan hyppighedstabellen se ud som nedenfor.



  Dette er Kinas befolkningspyramide for år 2005.   Zoom
Dette er Kinas befolkningspyramide for år 2005.  

Eksempel på en (absolut) frekvensfordeling. Dette er befolkningspyramiden for Angola for 2005.  Zoom
Eksempel på en (absolut) frekvensfordeling. Dette er befolkningspyramiden for Angola for 2005.  

Applikationer

Det er meget nemmere at administrere og arbejde med frekvenstabellerede data end at arbejde med rå data. Der findes enkle algoritmer til at beregne median, middelværdi (statistik), standardafvigelse osv. fra disse tabeller.

Statistisk hypotesetestning er baseret på vurderingen af forskelle og ligheder mellem frekvensfordelinger. Denne vurdering omfatter mål for central tendens eller gennemsnit, f.eks. middelværdi og median, og mål for variabilitet eller statistisk spredning, f.eks. standardafvigelse eller varians.

En frekvensfordeling siges at være skæv, når dens gennemsnit og median er forskellige. En frekvensfordelings kurtose er koncentrationen af scoringer ved middelværdien, eller hvor stor en spids fordelingen er, hvis den afbildes grafisk - f.eks. i et histogram. Hvis fordelingen er mere toppet end normalfordelingen, siges den at være leptokurtisk; hvis den er mindre toppet, siges den at være platykurtisk.

Frekvensfordelinger bruges også i frekvensanalyser til at knække koder og henviser til den relative hyppighed af bogstaver i forskellige sprog.

  • Oversigt
  • Indeks

Beskrivende statistik

Kontinuerlige data

Center

  • Median
  • Tilstand

Spredning

  • Afvigelse
  • Standardafvigelse
  • Gennemsnitlig absolut afvigelse
  • Variationskoefficient
  • Percentile
  • Område
  • Interkvartilområde

Form

    • Skewness
    • Kurtosis
    • L-momenter

Tælle data

  • Spredningsindeks

Oversigtstabeller

  • Grupperede data
  • Frekvensfordeling
  • Beredskabsplan

Afhængighed

  • Pearson-produkt-momentkorrelation
  • Rangkorrelation
  • Delvis korrelation
  • Spredningsdiagram

Grafik

  • Søjlediagram
  • Biplot
  • Box plot
  • Kontroldiagram
  • Korrelogram
  • Fan-diagram
  • Skovplot
  • Histogram
  • Cirkeldiagram
  • Q-Q-plot
  • Kør diagram
  • Spredningsdiagram
  • Stængel- og bladskærm
  • Radarkort
  • Handlingen på violin

Indsamling af data

Undersøgelsens design

  • Befolkning
  • Statistik
  • Effektstørrelse
  • Statistisk styrke
  • Optimalt design
  • Bestemmelse af stikprøvestørrelse
  • Replikation
  • Manglende data

Undersøgelsesmetodologi

    • stratificeret
    • klynge

Kontrollerede eksperimenter

Tilpasningsvenlige design

  • Adaptivt klinisk forsøg
  • Op-og-ned design
  • Stokastisk tilnærmelse

Observationsundersøgelser

  • Tværsnitsundersøgelse
  • Kohorteundersøgelse
  • Naturligt eksperiment
  • Quasi-eksperiment

Statistisk inferens

Statistisk teori

  • Befolkning
  • Statistik
  • Sandsynlighedsfordeling
  • Prøveudtagningsfordeling
    • Bestillingsstatistik
  • Empirisk fordeling
    • Skøn af tætheden
  • Statistisk model
    • Modelspecifikation
    • Lp plads
  • Parameter
    • placering
    • skala
    • form
  • Parametrisk familie
    • Sandsynlighed (monoton)
    • Familie i lokalitetsskala
    • Eksponentiel familie
  • Fuldstændighed
  • Tilstrækkelighed
  • Statistisk funktionel
    • Bootstrap
    • U
    • V
  • Optimal beslutning
    • tabsfunktion
  • Effektivitet
  • Statistisk afstand
    • divergens
  • Asymptotik
  • Robusthed

Frekvensbaseret inferens

Punktvurdering

  • Skøn af ligninger
    • Maksimal sandsynlighed
    • Momentmetoden
    • M-estimator
    • Mindsteafstand
  • Uforudsete estimatorer
    • Middelværdi-ubiaseret minimum-varians
      • Rao-Blackwellization
      • Lehmann-Scheffé-sætningen
    • Median uden forspring
  • Plug-in

Intervalvurdering

  • Konfidensinterval
  • Pivot
  • Sandsynlighedsinterval
  • Forudsigelsesinterval
  • Toleranceinterval
  • Genudtagning
    • Bootstrap
    • Jackknife

Afprøvning af hypoteser

  • 1- og 2-haler
  • Strøm
    • Ensartet mest effektive test
  • Permutationstest
    • Randomiseringstest
  • Flere sammenligninger

Parametriske test

  • Likelihood-ratio
  • Multiplikator for score/afvigelse
  • Wald

Specifikke prøver

  • Z-test (normal)
  • Student's t-test
  • F-test

God pasform

  • Chi-kvadrat
  • G-test
  • Kolmogorov-Smirnov
  • Anderson-Darling
  • Lilliefors
  • Jarque-Bera
  • Normalitet (Shapiro-Wilk)
  • Likelihood-ratio-test
  • Valg af model
    • Krydsvalidering
    • AIC
    • BIC

Rangstatistik

  • Skilt
    • Prøve median
  • Undertegnede rang (Wilcoxon)
    • Hodges-Lehmann-estimator
  • Rangsumme (Mann-Whitney)
  • Ikke-parametrisk anova
    • 1-vejs (Kruskal-Wallis)
    • 2-vejs (Friedman)
    • Bestilt alternativ (Jonckheere-Terpstra)

Bayesiansk inferens

  • Bayesiansk sandsynlighed
    • tidligere
    • bagerste del
  • Troværdigt interval
  • Bayes-faktor
  • Bayesiansk estimator
    • Maksimal posterior estimator
  • Korrelation
  • Regressionsanalyse

Korrelation

  • Pearson produkt-moment
  • Delvis korrelation
  • Forstyrrende variabel
  • Bestemmelseskoefficient

Regressionsanalyse

  • Fejl og residualer
  • Validering af regression
  • Modeller med blandede effekter
  • Simultane ligninger modeller
  • Multivariate adaptive regressionssplines (MARS)

Lineær regression

  • Simpel lineær regression
  • Almindelige mindste kvadrater
  • Generel lineær model
  • Bayesiansk regression

Ikke-standardiserede prædiktorer

  • Ikke-lineær regression
  • Ikke-parametrisk
  • Semiparametrisk
  • Isotonisk
  • Robust
  • Heteroscedasticitet
  • Homoscedasticitet

Generaliseret lineær model

  • Eksponentielle familier
  • Logistiske (Bernoulli) / binomiale / Poisson-regressioner

Fordeling af varians

  • Variansanalyse (ANOVA, anova)
  • Analyse af kovarians
  • Multivariat ANOVA
  • Frihedsgrader

Kategorisk / multivariat / tidsserier / overlevelsesanalyse

Kategorisk

  • Cohens kappa
  • Beredskabsplan
  • Grafisk model
  • Log-lineær model
  • McNemar's test
  • Cochran-Mantel-Haenszel-statistik

Multivariat

  • Regression
  • Manova
  • Hovedkomponenter
  • Kanonisk korrelation
  • Diskriminantanalyse
  • Klyngeanalyse
  • Klassifikation
  • Strukturel ligningsmodel
    • Faktoranalyse
  • Multivariate fordelinger
    • Elliptiske fordelinger
      • Normal

Tidsserier

Generelt

  • Nedbrydning
  • Trend
  • Stationæritet
  • Sæsonbestemt tilpasning
  • Eksponentiel udjævning
  • Kointegration
  • Strukturelt brud
  • Granger-kausalitet

Specifikke prøver

  • Dickey-Fuller
  • Johansen
  • Q-statistik (Ljung-Box)
  • Durbin-Watson
  • Breusch-Godfrey

Tidsdomæne

  • Autokorrelation (ACF)
    • delvis (PACF)
  • Krydskorrelation (XCF)
  • ARMA-model
  • ARIMA-model (Box-Jenkins)
  • Autoregressiv betinget heteroskedasticitet (ARCH)
  • Vector autoregression (VAR)

Frekvensdomæne

  • Estimation af spektraltæthed
  • Fourier-analyse
  • Wavelet
  • Whittle-sandsynlighed

Overlevelse

Overlevelsesfunktion

  • Kaplan-Meier-estimator (produktgrænse)
  • Proportional hazard-modeller
  • Model for accelereret svigttid (AFT)
  • Første slagtid

Farefunktion

  • Nelson-Aalen-estimator

Test

  • Log-rank-test

Anvendelser

Biostatistik

Ingeniørstatistik

  • Kemometri
  • Metoder teknik
  • Probabilistisk design
  • Proces-/kvalitetskontrol
  • Pålidelighed
  • Identifikation af systemet

Socialstatistik

  • Aktuarvidenskab
  • Folketælling
  • Kriminalitetsstatistik
  • Demografi
  • Økonometri
  • Jurimetrics
  • Nationalregnskaber
  • Officielle statistikker
  • Befolkningsstatistik
  • Psykometri

Rumlig statistik

  • Kartografi
  • Miljøstatistik
  • Geografisk informationssystem
  • Geostatistik
  • Kriging


 

Spørgsmål og svar

Spørgsmål: Hvad er en frekvensfordeling?


A: En frekvensfordeling er en liste over de værdier, som en variabel antager i en stikprøve, ordnet efter mængde. Den viser, hvor mange gange hver værdi forekommer.

Spørgsmål: Hvordan kan frekvensfordelingen af svarene på en fempunkts Likert-skala se ud?


Svar: Frekvensfordelingen af svarene på en fempunkts Likert-skala kan ligne en simpel tabel, der viser antallet af personer, der har vurderet hvert punkt på skalaen.

Sp: Hvad er to ulemper ved at bruge denne type tabel?


A: To ulemper ved at bruge denne type tabel er, at det kan være vanskeligt eller endog umuligt at bruge den, når der er tale om kontinuerte værdier, eller når der er for mange mulige værdier.

Spørgsmål: Hvordan er denne ordning anderledes, når der er tale om kontinuerlige værdier eller et stort antal mulige værdier?


Svar: Når der er tale om kontinuerlige værdier eller et stort antal mulige værdier, kan der i stedet anvendes en lidt anderledes ordning baseret på værdispænd.

Spørgsmål: Hvordan kan en hyppighedstabel for elevernes højde se ud?


Svar: Hyppighedstabellen for elevhøjder kan vise intervaller, og hvor mange elever der falder inden for hvert interval.


Spørgsmål: Hvilke oplysninger giver frekvensfordelingen?


Svar: Frekvensfordelingen giver oplysninger om, hvor ofte visse variabler forekommer i stikprøver, og hvordan de er fordelt på tværs af disse stikprøver.

AlegsaOnline.com - 2020 / 2023 - License CC3