Histogram: Definition, opbygning og eksempler i statistik

Lær hvad et histogram er, hvordan det bygges og se illustrative eksempler — nem guide til tolkning og opbygning af histogrammer i statistik.

Forfatter: Leandro Alegsa

Et histogram er et grundlæggende værktøj i statistikken. Det er en grafisk fremstilling, der viser, hvordan værdierne i et datasæt fordeler sig — altså hvordan hyppigheden af resultater fordeler sig over et kontinuum eller over intervaller. Typisk bygger et histogram på en tabel eller tælling, hvor man har grupperet observationer i klasser (ofte kaldet bins), og tabellen angiver, hvor mange prøver der ligger i hver klasse. Histogrammer bruges til at give et hurtigt visuelt indtryk af fordelingen: om den er symmetrisk, skæv, multimodal, eller om der findes outliers.

Opbygning af et histogram

Et histogram består af tilstødende søjler (rektangler). Hver søjles bredde svarer til et interval (klassebredde) på den målte variabel, og søjlens højde viser hyppigheden (antal observationer) i det interval. Der er nogle vigtige varianter:

  • Frekvens-histogram: søjlens højde er antal observationer i klassen.
  • Relativt frekvens-histogram: søjlens højde er andelen (procent eller sandsynlighed) af det samlede antal observationer i klassen.
  • Densitets-histogram: bruges især til kontinuerte data og når klasserne har forskellig bredde; søjlens areal (bredde × højde) repræsenterer andelen af observationerne i klassen. Højden er da typisk count / (n × binwidth).

Sådan vælger man intervaller (bins)

Valget af antal og bredde af intervaller påvirker histogrammets udseende. For få bins skjuler detaljer; for mange bins giver et "støjet" billede. Almindelige heuristikker:

  • Sturges' formel: k ≈ log2(n) + 1 — enkel og ofte brugt til mindre datasæt.
  • Freedman–Diaconis regel: binwidth = 2 × IQR / n^(1/3) — robust over for outliers og anbefales ofte til kontinuerte data.
  • Scott's regel: binwidth = 3.5 × σ / n^(1/3) — udnytter standardafvigelsen σ.

Det er også almindeligt at prøve flere bin-størrelser for at vurdere, hvilke træk i dataene der er stabile.

Tolkning og almindelige formtyper

Nogle klassiske mønstre i histogrammer og deres betydning:

  • Symmetrisk klokkeform: ofte tegn på en normalfordeling.
  • Højreskæv (positivt skæv): halen strækker sig mod højre — typisk for indkomster eller ventetider.
  • Venstreskæv (negativt skæv): halen strækker sig mod venstre.
  • Multimodal: flere toppe indikerer flere underliggende grupper eller blandinger af fordelinger.
  • Uniform: omtrent jævn højde over intervallet — data uden tydelig koncentration.

Ved at kombinere histogrammet med numeriske mål (median, middelværdi, IQR) får man et mere komplet billede af datasættets karakter.

Eksempler

Eksempel 1 — elevkarakterer: Hvis 100 eksamensresultater er grupperet i intervaller 0–9, 10–19, …, 90–100, viser et histogram hvilke scoreintervaller der er mest almindelige. Et højt søjle i 70–79-intervallet betyder mange elever i dét interval.

Eksempel 2 — højde i cm: For et datasæt med kontinuerte observationer (fx personers højde) er det ofte hensigtsmæssigt at bruge ens bredde på bins og evt. et densitets-histogram, så søjlens areal svarer til andelen i intervallet — dette gør histogrammet sammenligneligt med en sandsynlighedstæthed.

Forskelle mellem histogram og søjlediagram

  • Histogrammer bruges til numeriske, ofte kontinuerte data; søjlediagrammer til kategoriske data.
  • I histogrammer berører søjlerne ofte hinanden (da klasser dækker et kontinuum); i søjlediagrammer er der normalt afstand mellem søjlerne.
  • Højden i et søjlediagram repræsenterer direkte kategorihyppighed eller værdi; i histogrammet kan arealet være vigtigere ved varierende klassebredder.

Typiske fejl og gode råd

  • Undgå at bruge histogram for få observationer — støj kan villede fortolkningen.
  • Vær opmærksom på at ændre antal bins kan ændre opfattelsen af multimodalitet.
  • Hvis klasser har varierende bredde, brug densitet (areal) i stedet for blot søjlehøjde.
  • Suppler histogrammet med boxplot eller kumulativt histogram for bedre indsigt i median, spredning og outliers.

Ordet histogram er afledt af de græske ord histos og grammahistos betyder net eller mast, og gramma betyder tegning, optegnelse eller skrift. På et græsk etymologisk niveau er et histogram altså en tegning eller afbildning af et "væv" af data, hvilket forklarer navnets billedlige karakter i relation til at vise datapunkter samlet i klasser — se også etymologisk baggrund.

Til praktisk brug findes histogramfunktioner i de fleste statistik- og visualiseringsværktøjer (fx R, Python/Matplotlib, Excel), hvor man let kan justere antallet af bins, vælge tælling eller densitet, og kombinere histogrammet med en teoretisk tæthedskurve for sammenligning.

Eksempel på et histogram med 100 normalfordelte tilfældige værdierZoom
Eksempel på et histogram med 100 normalfordelte tilfældige værdier

Lignende idéer

Histogrammet er et af de syv grundlæggende værktøjer til kvalitetskontrol, som også omfatter Pareto-diagrammet, kontrolskemaet, kontroldiagrammet, årsags- og virkningsdiagrammet, flowdiagrammet og spredningsdiagrammet.

En generalisering af histogrammet er kerneudglatningsteknikker. Herved konstrueres en glat sandsynlighedstæthedsfunktion ud fra de leverede data.

Spørgsmål og svar

Q: Hvad er et histogram?


A: Et histogram er et grafisk display, der fortæller os om fordelingen af de involverede prøver.

Q: Hvad er formålet med et histogram?


A: Formålet med et histogram er at vise fordelingen af de involverede prøver.

Q: Hvad betyder ordet histogram?


A: Ordet histogram er afledt af histos og gramma på græsk. Histos betyder spindelvæv eller mast. Gramma betyder tegning, optegnelse eller skrivning.

Q: Hvad betyder udtrykket "histos" på græsk?


A: Udtrykket "histos" betyder spindelvæv eller mast på græsk.

Q: Hvad betyder udtrykket "gramma" på græsk?


A: Udtrykket "gramma" betyder tegning, optegnelse eller skrift på græsk.

Q: Hvad er et fælles træk ved et histogram?


A: Et histogram har det til fælles, at det er et billede lavet af en tabel med mange kategorier.

Q: Hvilke oplysninger giver en histogramtabel?


A: En histogramtabel giver information om, hvor mange prøver der er i hver kategori.


Søge
AlegsaOnline.com - 2020 / 2025 - License CC3