Konfidensinterval: Definition, beregning og tolkning i statistik

Lær konfidensintervallets definition, beregning og tolkning i statistik — forstå 95% konfidensniveau, antagelser og praktiske eksempler for præcis estimering.

Forfatter: Leandro Alegsa

Inden for statistik er et konfidensinterval en særlig form for estimering af en bestemt parameter. Med denne metode gives et helt interval af acceptable værdier for parameteren i stedet for en enkelt værdi sammen med en sandsynlighed for, at den reelle (ukendte) værdi af parameteren vil ligge inden for intervallet. Tillidsintervallet er baseret på observationerne fra en stikprøve og er derfor forskelligt fra stikprøve til stikprøve. Sandsynligheden for, at parameteren vil ligge i intervallet, kaldes konfidensniveauet. Meget ofte angives dette som en procentdel. Konfidensintervallet angives altid sammen med konfidensniveauet. Man kan tale om "95 % konfidensinterval". Slutpunkterne i konfidensintervallet kaldes konfidensgrænser. For en given estimationsprocedure i en given situation gælder det, at jo højere konfidensniveauet er, jo bredere er konfidensintervallet.

Beregningen af et konfidensinterval kræver generelt antagelser om arten af estimationsprocessen - det er primært en parametrisk metode. En almindelig antagelse er, at fordelingen af den population, som stikprøven stammer fra, er normal. Som sådan er konfidensintervaller, som de diskuteres nedenfor, ikke robuste statistikker, selv om der kan foretages ændringer for at tilføje robusthed.

Hvad betyder et konfidensinterval i praksis?

Et konfidensinterval angiver et interval af plausible værdier for en ukendt parameter (fx populationsgennemsnittet eller andelen). Et typisk udsagn er: "Vi er 95 % sikre på, at den sande parameter ligger mellem A og B." Det er vigtigt at forstå, at "95 % sikre" refererer til proceduren — hvis man gentagne gange gentog stikprøveudtagningen og beregnede 95 % konfidensintervaller hver gang, vil cirka 95 % af disse intervaller indeholde den sande værdi. For ét givet interval kan man ikke med sikkerhed sige, at sandsynligheden er 95 % for at netop dette interval indeholder parameteren; intervallet er enten korrekt (indeholder parameteren) eller forkert.

Typiske formler og beregningsmetoder

Konfidensintervallets midtpunkt er ofte en punktestimator (fx stikprøvegennemsnittet x̄ eller stikprøveandelen p̂). Bredde afhænger af estimatorens standardfejl og en kritisk værdi fra en passende fordelingskvantil.

  • Konfidensinterval for et middelværdi, kendt populationsstandardafvigelse σ:
    x̄ ± z* · (σ / √n), hvor z* er z-kvantil for valgt konfidensniveau (fx ≈1,96 for 95 %).
  • Konfidensinterval for et middelværdi, ukendt σ:
    x̄ ± t* · (s / √n), hvor s er stikprøvens standardafvigelse, og t* er kvantil fra t-fordelingen med n−1 frihedsgrader.
  • Konfidensinterval for en andel p̂ (Wald-approximation):
    p̂ ± z* · √(p̂(1−p̂)/n). (Bemærk: for små n eller når p̂ tæt på 0 eller 1 kan denne approximation være dårlig; alternative metoder som Wilson-intervallet anbefales.)

For andre parametre (varians, forskel mellem to middelværdier, regressionskoefficienter m.fl.) bruges tilsvarende formler med passende standardfejl og fordelingskvantiler.

Eksempel (95 % CI for et gennemsnit)

Antag x̄ = 100, s = 15 og n = 25. Da σ ukendt bruger vi t-fordelingen med 24 frihedsgrader. t* ≈ 2,064 for 95 % konfidens. CI = 100 ± 2,064·(15/√25) = 100 ± 2,064·3 = 100 ± 6,192 → (93,81; 106,19).

Antagelser og begrænsninger

  • Parametriske konfidensintervaller bygger ofte på antagelsen om normalfordeling (især ved små stikprøver). For store stikprøver gælder den centrale grænseværdisætning, så punktestimatorer nærmer sig normalfordelte.
  • Resultaterne afhænger af stikprøveudtagningsmetoden — tilfældig, uafhængig udtagning er et krav for mange standardformler.
  • Outliers og kraftig skevhed kan gøre standard CI'er upålidelige; robuste metoder eller transformationer kan være nødvendige.

Alternative og mere robuste metoder

  • Bootstrap: En ikke-parametrisk metode, hvor man gentagne gange resampler med tilbageførsel fra den observerede stikprøve og beregner empiriske percentiler for at danne et konfidensinterval. Brugbar når analytiske antagelser ikke holder.
  • Wilson-intervallet for andele: Giver ofte bedre dækningsegenskaber end Wald-intervallet, især ved små stikprøver eller ekstrem p̂.

Almindelige fejltolkninger

  • Forkert: "Der er 95 % sandsynlighed for, at den sande parameter ligger i dette specifikke interval." Korrekt: 95 % henviser til langtidsdækningen af proceduren.
  • Forkert: "Et snævrere interval betyder altid, at estimatet er bedre." Et snævert interval kan skyldes lavt konfidensniveau eller bias; kvalitet vurderes både på bias og præcision.
  • Konfidensintervallet siger ikke noget om praktisk betydning — kun om statistisk usikkerhed.

Hvordan rapportere et konfidensinterval

Angiv altid:

  • Stikprøveestimator (fx x̄ eller p̂) og konfidensintervallets grænser.
  • Konfidensniveau (fx 95 %).
  • Eventuelle antagelser (normalitet, uafhængighed) og hvilken metode der er brugt (t-fordeling, bootstrap, Wilson osv.).

Et eksempel: "Stikprøvegennemsnittet var 100 (95 % CI: 93,8–106,2), beregnet med t-fordelingen med 24 frihedsgrader."

Sammenhæng med hypoteseprøvning

Et (1−α)·100 % konfidensinterval svarer ofte til en tosidet hypotese-test med signifikansniveau α: hvis 0 (eller en anden hypotetisk værdi) ikke ligger i (1−α)·100 % CI for forskellen, vil den tilsvarende tosidede test forkaste nulhypotesen ved niveau α.

Effekt af stikprøvestørrelse og konfidensniveau

  • Større n → mindre standardfejl → smallere konfidensinterval.
  • Højere konfidensniveau (fx fra 95 % til 99 %) → større kritisk kvantil → bredere interval.
  • For at opnå en ønsket præcision Δ (halv-bredden) kan man vælge n ud fra formel n ≈ (z*·σ/Δ)² (når σ estimeres på forhånd).

Opsummering

Konfidensintervaller er et centralt værktøj til at udtrykke usikkerheden omkring en estimator. De kræver omtanke mht. antagelser og tolkning. Vælg passende metode (parametrisk, t- eller z-baseret, Wilson, bootstrap) afhængigt af stikprøvestørrelse, datas distribution og hvad der skal estimeres, og rapportér altid både interval og konfidensniveau tydeligt.

Betydning af udtrykket "tillid"

Udtrykket tillid har en lignende betydning inden for statistik, som i almindelig sprogbrug. I almindelig sprogbrug anses en påstand om 95 % tillid til noget normalt for at være udtryk for næsten sikkerhed. I statistikken betyder en påstand om 95 % tillid blot, at forskeren har set ét muligt interval ud af et stort antal mulige intervaller, hvoraf 19 ud af 20 intervaller indeholder den sande værdi af parameteren.

Praktisk eksempel

A factory assembly line fills margarine cups to a desired 250g +/- 5g

En maskine fylder kopper med margarine. I eksemplet er maskinen indstillet således, at indholdet i kopperne er 250 g margarine. Da maskinen ikke kan fylde alle kopper med præcis 250 g, viser indholdet i de enkelte kopper en vis variation og betragtes som en tilfældig variabel X. Denne variation antages at være normalfordelt omkring det ønskede gennemsnit på 250 g med en standardafvigelse på 2,5 g. For at fastslå, om maskinen er tilstrækkeligt kalibreret, udvælges en stikprøve på n = 25 kopper margarine tilfældigt, og kopperne vejes. Margarinevægtene er X1, ..., X25, et tilfældigt udsnit af X.

For at få et indtryk af forventningen μ er det tilstrækkeligt at give et skøn. Den passende estimator er stikprøvens gennemsnit:

μ ^ = X ¯ = 1 n ∑ i = 1 n X i . {\displaystyle {\hat {\mu }}={\bar {X}}}={\frac {1}{n}}}\sum _{i=1}^{n}}X_{i}. } {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.}

Prøven viser de faktiske vægte x1, ...,x25, med middelværdi:

x ¯ = 1 25 ∑ i = 1 25 x i = 250,2 gram . {\displaystyle {\bar {x}}}={\frac {1}{25}}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{gram}}. } {\displaystyle {\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{grams}}.}

Hvis vi tager en anden prøve på 25 kopper, kan vi nemt forvente at finde værdier som 250,4 eller 251,1 gram. En gennemsnitlig prøveværdi på 280 gram ville imidlertid være yderst sjældent, hvis det gennemsnitlige indhold af kopperne faktisk ligger tæt på 250 g. Der er et helt interval omkring den observerede værdi 250,2 for stikprøvens gennemsnit, inden for hvilket de observerede data ikke ville blive betragtet som særlig usædvanlige, hvis hele populationens gennemsnit faktisk har en værdi inden for dette interval. Et sådant interval kaldes et konfidensinterval for parameteren μ. Hvordan beregner man et sådant interval? Intervallets endepunkter skal beregnes ud fra stikprøven, så de er statistikker, funktioner af stikprøven X1, ..., X25 og dermed selv tilfældige variabler.

I vores tilfælde kan vi bestemme endepunkterne ved at overveje, at stikprøvens gennemsnit X fra en normalfordelt stikprøve også er normalfordelt med den samme forventning μ, men med standardfejl σ/√n = 0,5 (gram). Ved at standardisere får vi en tilfældig variabel

Z = X ¯ - μ σ / n = X ¯ - μ 0,5 {\displaystyle Z={\frac {{\bar {{\bar {X}}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}}-\mu }{0,5}}}} {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}}

afhængig af den parameter μ, der skal estimeres, men med en standard normalfordeling uafhængig af parameteren μ. Det er derfor muligt at finde tal -z og z, der er uafhængige af μ, hvor Z ligger midt imellem med sandsynligheden 1 - α, et mål for, hvor sikker vi ønsker at være. Vi tager 1 - α = 0,95. Så vi har:

P ( - z ≤ Z ≤ z ≤ z ) = 1 - α = 0,95. {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0,95.\,} {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0.95.\,}

Tallet z følger af den kumulative fordelingsfunktion:

Φ ( z ) = P ( Z ≤ z ) = 1 - α 2 = 0,975 , z = Φ - 1 ( Φ ( z ) ) = Φ - 1 ( 0,975 ) = 1.96 , {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}}} {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}}

og vi får:

0,95 = 1 - α = P ( - z ≤ Z ≤ z ) = P ( - 1,96 ≤ X ¯ - μ σ / n ≤ 1,96 ) = P ( X ¯ - 1,96 σ n ≤ μ ≤ μ ≤ X ¯ + 1.96 σ n ) = P ( X ¯ - 1,96 × 0,5 ≤ μ ≤ ≤ X ¯ + 1,96 × 0,5 ) = P ( X ¯ - 0,98 ≤ μ ≤ ≤ X ¯ + 0,98 ) . {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{{\bar {X}}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}}-1.96{\frac {\sigma }{\sqrt {n}}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}}\right)\\[6pt]&=P\left({\bar {X}}}-1.96\ gange 0.5\leq \mu \leq \leq {\bar {X}}+1.96\ gange 0.5\right)\\[6pt]&=P\left({\bar {X}}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}} {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}}

Dette kan fortolkes som: med en sandsynlighed på 0,95 finder vi et konfidensinterval, hvor vi møder parameteren μ mellem de stokastiske endepunkter

X ¯ - 0 . 98 {\displaystyle {\bar {\bar {X}}}-0{.}98\,} {\displaystyle {\bar {X}}-0{.}98\,}

og

X ¯ + 0.98. {\displaystyle {\bar {\bar {X}}}+0.98.\,} {\displaystyle {\bar {X}}+0.98.\,}

Det betyder ikke, at der er 0,95 sandsynlighed for at parameteren μ findes i det beregnede interval. Hver gang målingerne gentages, vil der være en anden værdi for prøvens gennemsnit X. I 95 % af tilfældene vil μ ligge mellem de endepunkter, der er beregnet ud fra dette gennemsnit, men i 5 % af tilfældene vil det ikke være tilfældet. Det faktiske konfidensinterval beregnes ved at indtaste de målte vægte i formlen. Vores 0,95 konfidensinterval bliver:

( x ¯ - 0,98 ; x ¯ + 0,98 ) = ( 250,2 - 0,98 ; 250,2 + 0,98 ) = ( 249,22 ; 251,18 ) . {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,} {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,}

Da den ønskede værdi 250 for μ ligger inden for det resulterende konfidensinterval, er der ingen grund til at tro, at maskinen er fejlkalibreret.

Det beregnede interval har faste endepunkter, hvor μ kan ligge imellem (eller ej). Denne hændelse har således en sandsynlighed på enten 0 eller 1. Det kan vi ikke sige: Vi kan ikke sige: "Med sandsynlighed (1 - α) ligger parameteren μ i konfidensintervallet." Vi ved kun, at ved gentagelse i 100(1 - α) % af tilfældene vil μ ligge i det beregnede interval. I 100α % af tilfældene gør den det imidlertid ikke. Og desværre ved vi ikke, i hvilke af tilfældene dette sker. Det er derfor, vi siger: "med et konfidensniveau på 100(1 - α) % ligger μ i konfidensintervallet. "

Figuren til højre viser 50 realiseringer af et konfidensinterval for en given populationsmiddelværdi μ. Hvis vi tilfældigt vælger én realisering, er sandsynligheden 95% for, at vi ender med at vælge et interval, der indeholder parameteren; vi kan dog være uheldige og have valgt den forkerte. Det får vi aldrig at vide; vi sidder fast med vores interval.

De lodrette linjesegmenter repræsenterer 50 realiseringer af et konfidensinterval for μ.Zoom
De lodrette linjesegmenter repræsenterer 50 realiseringer af et konfidensinterval for μ.

Spørgsmål og svar

Spørgsmål: Hvad er et konfidensinterval i statistik?


A: Et konfidensinterval er et særligt interval, der bruges til at estimere en parameter, f.eks. populationens gennemsnit, og som giver et interval af acceptable værdier for parameteren i stedet for en enkelt værdi.

Spørgsmål: Hvorfor anvendes et konfidensinterval i stedet for en enkelt værdi?


Svar: Et konfidensinterval anvendes i stedet for en enkelt værdi for at tage højde for usikkerheden ved at estimere en parameter på grundlag af en stikprøve og for at give en sandsynlighed for, at den reelle værdi af parameteren ligger inden for intervallet.

Spørgsmål: Hvad er et konfidensniveau?


Svar: Et konfidensniveau er sandsynligheden for, at den parameter, der estimeres, ligger inden for konfidensintervallet, og angives ofte som en procentdel (f.eks. 95 % konfidensinterval).

Spørgsmål: Hvad er konfidensgrænser?


A: Konfidensgrænser er endepunkterne i et konfidensinterval, som definerer intervallet af acceptable værdier for den parameter, der estimeres.

Spørgsmål: Hvordan påvirker konfidensniveauet konfidensintervallet?


Svar: I en given estimationsprocedure gælder det, at jo højere konfidensniveauet er, jo bredere bliver konfidensintervallet.

Spørgsmål: Hvilke antagelser er nødvendige for at beregne et konfidensinterval?


Svar: Beregningen af et konfidensinterval kræver generelt antagelser om estimationsprocessens karakter, f.eks. antagelsen om, at fordelingen af den population, som stikprøven stammer fra, er normal.

Spørgsmål: Er konfidensintervaller robuste statistikker?


Svar: Konfidensintervaller er som beskrevet nedenfor ikke robuste statistikker, selv om der kan foretages justeringer for at tilføje robusthed.


Søge
AlegsaOnline.com - 2020 / 2025 - License CC3