Standardafvigelse er et tal, der bruges til at fortælle, hvordan målingerne for en gruppe er spredt ud fra gennemsnittet (middelværdien eller den forventede værdi). En lav standardafvigelse betyder, at de fleste tal ligger tæt på gennemsnittet, mens en høj standardafvigelse betyder, at tallene er mere spredte.

Den rapporterede fejlmargin er normalt dobbelt så stor som standardafvigelsen. Forskere rapporterer normalt standardafvigelsen for tal fra det gennemsnitlige tal i eksperimenter. De beslutter ofte, at kun forskelle, der er større end to eller tre gange standardafvigelsen, er vigtige. Standardafvigelse er også nyttig i forbindelse med penge, hvor standardafvigelsen for renteindtægter viser, hvor stor forskel en persons renteindtægt kan være på gennemsnittet.

Mange gange kan der kun måles en stikprøve eller en del af en gruppe. Så kan man finde et tal tæt på standardafvigelsen for hele gruppen ved hjælp af en lidt anderledes ligning, der kaldes stikprøvens standardafvigelse, som forklares nedenfor. I så fald repræsenteres standardafvigelsen for hele gruppen af det græske bogstav {\displaystyle \sigma }, og stikprøvens ved {\displaystyle s} .




 

Hvad er standardafvigelse?

Standardafvigelse er et mål for spredningen i en mængde tal. Den beskriver typisk, hvor langt observationerne ligger fra gennemsnittet. Hvis standardafvigelsen er lille, er observationerne tætte omkring gennemsnittet; hvis den er stor, er observationerne mere udsivede.

Formel

Der er to almindelige varianter:

  • Populationsstandardafvigelse (når du har data for hele populationen): σ = sqrt( (1/N) * Σ(xi - μ)² ). Her er N antallet af observationer og μ populationsgennemsnittet.
  • Stikprøvestandardafvigelse (når du har en stikprøve fra populationen): s = sqrt( (1/(n-1)) * Σ(xi - x̄)² ). Her er n stikprøvestørrelsen og x̄ stikprøvegennemsnittet. Divisor n−1 kaldes Bessels korrektion og giver et upartisk estimat af populationsvariansen.

Trin for trin: Sådan beregnes standardafvigelsen

Følgende procedure gælder for både population og stikprøve; kun divisor (N eller n−1) ændres:

  • 1) Beregn gennemsnittet (μ eller x̄).
  • 2) For hver observation træk gennemsnittet fra (xi − gennemsnit) og kvadrér resultatet.
  • 3) Summér alle kvadrerede afvigelser.
  • 4) Divider summen med N (population) eller n−1 (stikprøve) for at få variansen.
  • 5) Tag kvadratroden af variansen for at få standardafvigelsen.

Eksempel

Data: 2, 4, 4, 4, 5, 5, 7, 9

  • Gennemsnit = (2+4+4+4+5+5+7+9)/8 = 5
  • Kvadrerede afvigelser: 9, 1, 1, 1, 0, 0, 4, 16 (sum = 32)
  • Populationsvarians = 32/8 = 4 → populationsstandardafvigelse σ = sqrt(4) = 2
  • Stikprøvevarians = 32/7 ≈ 4,5714 → stikprøvestandardafvigelse s ≈ 2,138

Tolkning og praktiske regler

  • Enkelt fortalt siger standardafvigelsen hvor "bred" fordelingen er omkring gennemsnittet.
  • For en tilnærmelsesvis normalfordelt variabel gælder den såkaldte 68–95–99,7-regel: cirka 68 % af observationerne ligger inden for ±1σ fra gennemsnittet, cirka 95 % inden for ±2σ og cirka 99,7 % inden for ±3σ.
  • Standardafvigelsens enhed er den samme som dataene (fx kg, sek., kr.), fordi den er kvadratroden af variansen.
  • Varians = (standardafvigelse)².

Anvendelser

  • Statistik og forskning: rapportering af spredning omkring middelværdien og vurdering af signifikans (fx når forskelle overstiger 2–3 gange standardafvigelsen).
  • Finans: måler volatilitet i afkast og risiko.
  • Kvalitetskontrol: bruges i kontrolkort for at vurdere, om en proces er stabil.
  • Ingeniørarbejde og måleteknik: angiver usikkerhed i målinger (sammen med standardfejl og konfidensintervaller).

Ofte stillede bemærkninger og faldgruber

  • Fejlmargin og standardfejl: Den rapporterede fejlmargin (fx for et 95 % konfidensinterval) er ikke blot "to gange standardafvigelsen". Typisk er fejlmargin ≈ z* · (standardafvigelse/√n), hvor z*≈1,96 for 95 % konfidens. Altså er fejlmargin omtrent to gange standardfejlen (standardafvigelse delt med √n), ikke to gange selve standardafvigelsen.
  • Følsomhed over for outliers: standardafvigelsen påvirkes stærkt af enkelte ekstreme værdier. Ved skæve fordelinger eller outliers kan median og intervallet mellem 1. og 3. kvartil (IQR) eller medianabsolut afvigelse (MAD) være bedre beskrivelser.
  • Valg af formel: Brug n−1 når du beregner fra en stikprøve og ønsker et upartisk estimat af populationsvariansen; brug N når du har hele populationen.

Sådan beregnes det hurtigt i værktøjer

  • Excel (engelsk): STDEV.P(range) for populationsstandardafvigelse, STDEV.S(range) for stikprøvestandardafvigelse.
  • Python (NumPy): numpy.std(data, ddof=0) for population, numpy.std(data, ddof=1) for stikprøve (ddof = degrees of freedom).
  • Regnere og statistiksoftware: de fleste pakker tilbyder både population- og stikprøvefunktioner — vælg den korrekte, afhængigt af om du har hele populationen eller kun en stikprøve.

Anbefalinger ved rapportering

  • Angiv om du rapporterer populations- eller stikprøvestandardafvigelse (σ vs. s).
  • Ved skæve data: overvej at rapportere median og IQR i stedet for gennemsnit ± SD.
  • Forklar eventuelle udligningsregler (fx bortfjernelse af outliers) så læseren kan vurdere resultaterne korrekt.