I matematik og statistik er middelværdien en slags gennemsnit. Ud over det almindelige (aritmetiske) gennemsnit findes der flere andre typer gennemsnit, hver med sine anvendelser, fordele og ulemper.

Hvad er aritmetisk middelværdi?

Det mest almindelige gennemsnit er det aritmetiske gennemsnit. Det beregnes ved at lægge alle værdierne sammen og dividere med antallet af værdier. Hvis værdierne er x1, x2, ..., xn, så er aritmetisk middelværdi:

x̄ = (x1 + x2 + ... + xn) / n

Eksempel og tolkning

Tag f.eks. datasættet 1, 2, 2, 2, 100, 100. Summen af tallene er 1 + 2 + 2 + 2 + 100 + 100 = 207. Der er 6 tal, så det aritmetiske gennemsnit er 207 / 6 = 34,5.

Dette viser en vigtig pointe: det aritmetiske gennemsnit er følsomt over for ekstreme værdier (outliers). Selvom gennemsnittet er 34,5, ligger de fleste observationer omkring 2, så gennemsnittet giver et misvisende billede i dette tilfælde.

Alternative mål for centraltendens for samme datasæt:

  • Median (midterværdien): For 1,2,2,2,100,100 er medianen gennemsnittet af 3.- og 4.-værdien = (2 + 2) / 2 = 2. Medianen er robust over for ekstreme værdier.
  • Typetal (modus): Det mest hyppigt forekommende tal er 2.

Andre typer gennemsnit og hvornår man bruger dem

  • Vægtet middelværdi — bruges når nogle observationer skal tælle mere end andre. Formel: (Σ wi·xi) / (Σ wi). Eksempel: karakterer med vægtninger eller gennemsnitspris med mængde som vægte.
  • Geometrisk middelværdi — nyttig ved gennemsnitlig vækst eller multiplicative størrelser. Hvis faktorerne er g1, g2, ..., gn, så er geometrisk middelværdi (g1·g2·...·gn)^(1/n). Bruges fx ved årlige vækstrater eller investeringsafkast.
  • Harmonisk middelværdi — relevant når gennemsnittet af hastigheder eller forhold beregnes (når det er inversen af størrelsen, der summeres). For to hastigheder v1 og v2 for samme distance: harmonisk middel = 2 / (1/v1 + 1/v2). Eksempel: hvis man kører samme distance med 60 km/t og 120 km/t, bliver den gennemsnitlige hastighed 80 km/t.
  • Trimmet gennemsnit — fjerner en procentdel af de højeste og laveste værdier før beregning af gennemsnittet. Bruges for at reducere effekten af outliers, uden helt at gå over til medianen.

Population vs. stikprøve

I statistik skelner man mellem populationsmiddelværdi (ofte betegnet μ) og stikprøve-middelværdi (ofte betegnet x̄). Begge beregnes principielt på samme måde, men i stikprøve-sammenhænge bruger man gennemsnittet som et estimat af populationsmidlet.

Hvornår skal man vælge hvilket mål?

  • Brug aritmetisk middelværdi når data er symmetriske og uden ekstreme værdier.
  • Brug medianen når data er skævt fordelt eller indeholder outliers.
  • Brug modus når du er interesseret i den hyppigst forekommende værdi.
  • Brug vægtet gennemsnit når observationerne har forskellig betydning eller hyppighed.
  • Brug geometrisk eller harmonisk middel når målene er multiplicative eller inverse størrelser.

Kort opsummering

  • Middelværdi er et begreb for centraltendens — det mest kendte er det aritmetiske gennemsnit.
  • Der findes flere typer gennemsnit (aritmetisk, vægtet, geometrisk, harmonisk, median, modus), og valget afhænger af datasættets karakter og hvilket spørgsmål man vil besvare.
  • Vær opmærksom på outliers — de kan trække det aritmetiske gennemsnit væsentligt væk fra, hvad der opleves som "typisk".