Inden for statistik er et konfidensinterval en særlig form for estimering af en bestemt parameter. Med denne metode gives et helt interval af acceptable værdier for parameteren i stedet for en enkelt værdi sammen med en sandsynlighed for, at den reelle (ukendte) værdi af parameteren vil ligge inden for intervallet. Tillidsintervallet er baseret på observationerne fra en stikprøve og er derfor forskelligt fra stikprøve til stikprøve. Sandsynligheden for, at parameteren vil ligge i intervallet, kaldes konfidensniveauet. Meget ofte angives dette som en procentdel. Konfidensintervallet angives altid sammen med konfidensniveauet. Man kan tale om "95 % konfidensinterval". Slutpunkterne i konfidensintervallet kaldes konfidensgrænser. For en given estimationsprocedure i en given situation gælder det, at jo højere konfidensniveauet er, jo bredere er konfidensintervallet.
Beregningen af et konfidensinterval kræver generelt antagelser om arten af estimationsprocessen - det er primært en parametrisk metode. En almindelig antagelse er, at fordelingen af den population, som stikprøven stammer fra, er normal. Som sådan er konfidensintervaller, som de diskuteres nedenfor, ikke robuste statistikker, selv om der kan foretages ændringer for at tilføje robusthed.
Hvad betyder et konfidensinterval i praksis?
Et konfidensinterval angiver et interval af plausible værdier for en ukendt parameter (fx populationsgennemsnittet eller andelen). Et typisk udsagn er: "Vi er 95 % sikre på, at den sande parameter ligger mellem A og B." Det er vigtigt at forstå, at "95 % sikre" refererer til proceduren — hvis man gentagne gange gentog stikprøveudtagningen og beregnede 95 % konfidensintervaller hver gang, vil cirka 95 % af disse intervaller indeholde den sande værdi. For ét givet interval kan man ikke med sikkerhed sige, at sandsynligheden er 95 % for at netop dette interval indeholder parameteren; intervallet er enten korrekt (indeholder parameteren) eller forkert.
Typiske formler og beregningsmetoder
Konfidensintervallets midtpunkt er ofte en punktestimator (fx stikprøvegennemsnittet x̄ eller stikprøveandelen p̂). Bredde afhænger af estimatorens standardfejl og en kritisk værdi fra en passende fordelingskvantil.
- Konfidensinterval for et middelværdi, kendt populationsstandardafvigelse σ:
x̄ ± z* · (σ / √n), hvor z* er z-kvantil for valgt konfidensniveau (fx ≈1,96 for 95 %). - Konfidensinterval for et middelværdi, ukendt σ:
x̄ ± t* · (s / √n), hvor s er stikprøvens standardafvigelse, og t* er kvantil fra t-fordelingen med n−1 frihedsgrader. - Konfidensinterval for en andel p̂ (Wald-approximation):
p̂ ± z* · √(p̂(1−p̂)/n). (Bemærk: for små n eller når p̂ tæt på 0 eller 1 kan denne approximation være dårlig; alternative metoder som Wilson-intervallet anbefales.)
For andre parametre (varians, forskel mellem to middelværdier, regressionskoefficienter m.fl.) bruges tilsvarende formler med passende standardfejl og fordelingskvantiler.
Eksempel (95 % CI for et gennemsnit)
Antag x̄ = 100, s = 15 og n = 25. Da σ ukendt bruger vi t-fordelingen med 24 frihedsgrader. t* ≈ 2,064 for 95 % konfidens. CI = 100 ± 2,064·(15/√25) = 100 ± 2,064·3 = 100 ± 6,192 → (93,81; 106,19).
Antagelser og begrænsninger
- Parametriske konfidensintervaller bygger ofte på antagelsen om normalfordeling (især ved små stikprøver). For store stikprøver gælder den centrale grænseværdisætning, så punktestimatorer nærmer sig normalfordelte.
- Resultaterne afhænger af stikprøveudtagningsmetoden — tilfældig, uafhængig udtagning er et krav for mange standardformler.
- Outliers og kraftig skevhed kan gøre standard CI'er upålidelige; robuste metoder eller transformationer kan være nødvendige.
Alternative og mere robuste metoder
- Bootstrap: En ikke-parametrisk metode, hvor man gentagne gange resampler med tilbageførsel fra den observerede stikprøve og beregner empiriske percentiler for at danne et konfidensinterval. Brugbar når analytiske antagelser ikke holder.
- Wilson-intervallet for andele: Giver ofte bedre dækningsegenskaber end Wald-intervallet, især ved små stikprøver eller ekstrem p̂.
Almindelige fejltolkninger
- Forkert: "Der er 95 % sandsynlighed for, at den sande parameter ligger i dette specifikke interval." Korrekt: 95 % henviser til langtidsdækningen af proceduren.
- Forkert: "Et snævrere interval betyder altid, at estimatet er bedre." Et snævert interval kan skyldes lavt konfidensniveau eller bias; kvalitet vurderes både på bias og præcision.
- Konfidensintervallet siger ikke noget om praktisk betydning — kun om statistisk usikkerhed.
Hvordan rapportere et konfidensinterval
Angiv altid:
- Stikprøveestimator (fx x̄ eller p̂) og konfidensintervallets grænser.
- Konfidensniveau (fx 95 %).
- Eventuelle antagelser (normalitet, uafhængighed) og hvilken metode der er brugt (t-fordeling, bootstrap, Wilson osv.).
Et eksempel: "Stikprøvegennemsnittet var 100 (95 % CI: 93,8–106,2), beregnet med t-fordelingen med 24 frihedsgrader."
Sammenhæng med hypoteseprøvning
Et (1−α)·100 % konfidensinterval svarer ofte til en tosidet hypotese-test med signifikansniveau α: hvis 0 (eller en anden hypotetisk værdi) ikke ligger i (1−α)·100 % CI for forskellen, vil den tilsvarende tosidede test forkaste nulhypotesen ved niveau α.
Effekt af stikprøvestørrelse og konfidensniveau
- Større n → mindre standardfejl → smallere konfidensinterval.
- Højere konfidensniveau (fx fra 95 % til 99 %) → større kritisk kvantil → bredere interval.
- For at opnå en ønsket præcision Δ (halv-bredden) kan man vælge n ud fra formel n ≈ (z*·σ/Δ)² (når σ estimeres på forhånd).
Opsummering
Konfidensintervaller er et centralt værktøj til at udtrykke usikkerheden omkring en estimator. De kræver omtanke mht. antagelser og tolkning. Vælg passende metode (parametrisk, t- eller z-baseret, Wilson, bootstrap) afhængigt af stikprøvestørrelse, datas distribution og hvad der skal estimeres, og rapportér altid både interval og konfidensniveau tydeligt.


