Konfidensinterval

Inden for statistik er et konfidensinterval en særlig form for estimering af en bestemt parameter. Med denne metode gives et helt interval af acceptable værdier for parameteren i stedet for en enkelt værdi sammen med en sandsynlighed for, at den reelle (ukendte) værdi af parameteren vil ligge inden for intervallet. Tillidsintervallet er baseret på observationerne fra en stikprøve og er derfor forskelligt fra stikprøve til stikprøve. Sandsynligheden for, at parameteren vil ligge i intervallet, kaldes konfidensniveauet. Meget ofte angives dette som en procentdel. Konfidensintervallet angives altid sammen med konfidensniveauet. Man kan tale om "95 % konfidensinterval". Slutpunkterne i konfidensintervallet kaldes konfidensgrænser. For en given estimationsprocedure i en given situation gælder det, at jo højere konfidensniveauet er, jo bredere er konfidensintervallet.

Beregningen af et konfidensinterval kræver generelt antagelser om arten af estimationsprocessen - det er primært en parametrisk metode. En almindelig antagelse er, at fordelingen af den population, som stikprøven stammer fra, er normal. Som sådan er konfidensintervaller, som de diskuteres nedenfor, ikke robuste statistikker, selv om der kan foretages ændringer for at tilføje robusthed.

Betydning af udtrykket "tillid"

Udtrykket tillid har en lignende betydning inden for statistik, som i almindelig sprogbrug. I almindelig sprogbrug anses en påstand om 95 % tillid til noget normalt for at være udtryk for næsten sikkerhed. I statistikken betyder en påstand om 95 % tillid blot, at forskeren har set ét muligt interval ud af et stort antal mulige intervaller, hvoraf 19 ud af 20 intervaller indeholder den sande værdi af parameteren.

Praktisk eksempel

A factory assembly line fills margarine cups to a desired 250g +/- 5g

En maskine fylder kopper med margarine. I eksemplet er maskinen indstillet således, at indholdet i kopperne er 250 g margarine. Da maskinen ikke kan fylde alle kopper med præcis 250 g, viser indholdet i de enkelte kopper en vis variation og betragtes som en tilfældig variabel X. Denne variation antages at være normalfordelt omkring det ønskede gennemsnit på 250 g med en standardafvigelse på 2,5 g. For at fastslå, om maskinen er tilstrækkeligt kalibreret, udvælges en stikprøve på n = 25 kopper margarine tilfældigt, og kopperne vejes. Margarinevægtene er X1, ..., X25, et tilfældigt udsnit af X.

For at få et indtryk af forventningen μ er det tilstrækkeligt at give et skøn. Den passende estimator er stikprøvens gennemsnit:

μ ^ = X ¯ = 1 n ∑ i = 1 n X i . {\displaystyle {\hat {\mu }}={\bar {X}}}={\frac {1}{n}}}\sum _{i=1}^{n}}X_{i}. } {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.}

Prøven viser de faktiske vægte x1, ...,x25, med middelværdi:

x ¯ = 1 25 ∑ i = 1 25 x i = 250,2 gram . {\displaystyle {\bar {x}}}={\frac {1}{25}}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{gram}}. } {\displaystyle {\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{grams}}.}

Hvis vi tager en anden prøve på 25 kopper, kan vi nemt forvente at finde værdier som 250,4 eller 251,1 gram. En gennemsnitlig prøveværdi på 280 gram ville imidlertid være yderst sjældent, hvis det gennemsnitlige indhold af kopperne faktisk ligger tæt på 250 g. Der er et helt interval omkring den observerede værdi 250,2 for stikprøvens gennemsnit, inden for hvilket de observerede data ikke ville blive betragtet som særlig usædvanlige, hvis hele populationens gennemsnit faktisk har en værdi inden for dette interval. Et sådant interval kaldes et konfidensinterval for parameteren μ. Hvordan beregner man et sådant interval? Intervallets endepunkter skal beregnes ud fra stikprøven, så de er statistikker, funktioner af stikprøven X1, ..., X25 og dermed selv tilfældige variabler.

I vores tilfælde kan vi bestemme endepunkterne ved at overveje, at stikprøvens gennemsnit X fra en normalfordelt stikprøve også er normalfordelt med den samme forventning μ, men med standardfejl σ/√n = 0,5 (gram). Ved at standardisere får vi en tilfældig variabel

Z = X ¯ - μ σ / n = X ¯ - μ 0,5 {\displaystyle Z={\frac {{\bar {{\bar {X}}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}}-\mu }{0,5}}}} {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}}

afhængig af den parameter μ, der skal estimeres, men med en standard normalfordeling uafhængig af parameteren μ. Det er derfor muligt at finde tal -z og z, der er uafhængige af μ, hvor Z ligger midt imellem med sandsynligheden 1 - α, et mål for, hvor sikker vi ønsker at være. Vi tager 1 - α = 0,95. Så vi har:

P ( - z ≤ Z ≤ z ≤ z ) = 1 - α = 0,95. {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0,95.\,} {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0.95.\,}

Tallet z følger af den kumulative fordelingsfunktion:

Φ ( z ) = P ( Z ≤ z ) = 1 - α 2 = 0,975 , z = Φ - 1 ( Φ ( z ) ) = Φ - 1 ( 0,975 ) = 1.96 , {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}}} {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}}

og vi får:

0,95 = 1 - α = P ( - z ≤ Z ≤ z ) = P ( - 1,96 ≤ X ¯ - μ σ / n ≤ 1,96 ) = P ( X ¯ - 1,96 σ n ≤ μ ≤ μ ≤ X ¯ + 1.96 σ n ) = P ( X ¯ - 1,96 × 0,5 ≤ μ ≤ ≤ X ¯ + 1,96 × 0,5 ) = P ( X ¯ - 0,98 ≤ μ ≤ ≤ X ¯ + 0,98 ) . {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{{\bar {X}}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}}-1.96{\frac {\sigma }{\sqrt {n}}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}}\right)\\[6pt]&=P\left({\bar {X}}}-1.96\ gange 0.5\leq \mu \leq \leq {\bar {X}}+1.96\ gange 0.5\right)\\[6pt]&=P\left({\bar {X}}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}} {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}}

Dette kan fortolkes som: med en sandsynlighed på 0,95 finder vi et konfidensinterval, hvor vi møder parameteren μ mellem de stokastiske endepunkter

X ¯ - 0 . 98 {\displaystyle {\bar {\bar {X}}}-0{.}98\,} {\displaystyle {\bar {X}}-0{.}98\,}

og

X ¯ + 0.98. {\displaystyle {\bar {\bar {X}}}+0.98.\,} {\displaystyle {\bar {X}}+0.98.\,}

Det betyder ikke, at der er 0,95 sandsynlighed for at parameteren μ findes i det beregnede interval. Hver gang målingerne gentages, vil der være en anden værdi for prøvens gennemsnit X. I 95 % af tilfældene vil μ ligge mellem de endepunkter, der er beregnet ud fra dette gennemsnit, men i 5 % af tilfældene vil det ikke være tilfældet. Det faktiske konfidensinterval beregnes ved at indtaste de målte vægte i formlen. Vores 0,95 konfidensinterval bliver:

( x ¯ - 0,98 ; x ¯ + 0,98 ) = ( 250,2 - 0,98 ; 250,2 + 0,98 ) = ( 249,22 ; 251,18 ) . {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,} {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,}

Da den ønskede værdi 250 for μ ligger inden for det resulterende konfidensinterval, er der ingen grund til at tro, at maskinen er fejlkalibreret.

Det beregnede interval har faste endepunkter, hvor μ kan ligge imellem (eller ej). Denne hændelse har således en sandsynlighed på enten 0 eller 1. Det kan vi ikke sige: Vi kan ikke sige: "Med sandsynlighed (1 - α) ligger parameteren μ i konfidensintervallet." Vi ved kun, at ved gentagelse i 100(1 - α) % af tilfældene vil μ ligge i det beregnede interval. I 100α % af tilfældene gør den det imidlertid ikke. Og desværre ved vi ikke, i hvilke af tilfældene dette sker. Det er derfor, vi siger: "med et konfidensniveau på 100(1 - α) % ligger μ i konfidensintervallet. "

Figuren til højre viser 50 realiseringer af et konfidensinterval for en given populationsmiddelværdi μ. Hvis vi tilfældigt vælger én realisering, er sandsynligheden 95% for, at vi ender med at vælge et interval, der indeholder parameteren; vi kan dog være uheldige og have valgt den forkerte. Det får vi aldrig at vide; vi sidder fast med vores interval.

De lodrette linjesegmenter repræsenterer 50 realiseringer af et konfidensinterval for μ.Zoom
De lodrette linjesegmenter repræsenterer 50 realiseringer af et konfidensinterval for μ.

Spørgsmål og svar

Spørgsmål: Hvad er et konfidensinterval i statistik?


A: Et konfidensinterval er et særligt interval, der bruges til at estimere en parameter, f.eks. populationens gennemsnit, og som giver et interval af acceptable værdier for parameteren i stedet for en enkelt værdi.

Spørgsmål: Hvorfor anvendes et konfidensinterval i stedet for en enkelt værdi?


Svar: Et konfidensinterval anvendes i stedet for en enkelt værdi for at tage højde for usikkerheden ved at estimere en parameter på grundlag af en stikprøve og for at give en sandsynlighed for, at den reelle værdi af parameteren ligger inden for intervallet.

Spørgsmål: Hvad er et konfidensniveau?


Svar: Et konfidensniveau er sandsynligheden for, at den parameter, der estimeres, ligger inden for konfidensintervallet, og angives ofte som en procentdel (f.eks. 95 % konfidensinterval).

Spørgsmål: Hvad er konfidensgrænser?


A: Konfidensgrænser er endepunkterne i et konfidensinterval, som definerer intervallet af acceptable værdier for den parameter, der estimeres.

Spørgsmål: Hvordan påvirker konfidensniveauet konfidensintervallet?


Svar: I en given estimationsprocedure gælder det, at jo højere konfidensniveauet er, jo bredere bliver konfidensintervallet.

Spørgsmål: Hvilke antagelser er nødvendige for at beregne et konfidensinterval?


Svar: Beregningen af et konfidensinterval kræver generelt antagelser om estimationsprocessens karakter, f.eks. antagelsen om, at fordelingen af den population, som stikprøven stammer fra, er normal.

Spørgsmål: Er konfidensintervaller robuste statistikker?


Svar: Konfidensintervaller er som beskrevet nedenfor ikke robuste statistikker, selv om der kan foretages justeringer for at tilføje robusthed.

AlegsaOnline.com - 2020 / 2023 - License CC3