Stikprøve | del af en population
I statistik er en stikprøve en del af en population. Prøven er omhyggeligt udvalgt. Den skal repræsentere hele populationen retfærdigt og uden skævheder.
Når en stikprøve behandles som et datasæt, repræsenteres den ofte med store bogstaver som
og , mens dens elementer repræsenteres med små bogstaver (f.eks. stikprøvens størrelse repræsenteres med bogstavet .Grunden til, at der er behov for stikprøver, er, at populationerne kan være så store, at det ikke er muligt eller praktisk muligt at tælle alle individer. Derfor starter løsningen af et problem i statistikken normalt med stikprøver. Stikprøveudtagning handler om at vælge, hvilke data der skal udtages med henblik på senere analyse. Lad os som eksempel antage, at forureningen af en sø skal analyseres med henblik på en undersøgelse. Afhængigt af, hvor vandprøverne er taget, kan undersøgelserne give forskellige resultater.
Som en generel regel skal stikprøverne være tilfældige. Det betyder, at chancen eller sandsynligheden for at udvælge et individ er den samme som chancen for at udvælge ethvert andet individ.
I praksis udtages stikprøver altid efter en veldefineret procedure. En procedure er et sæt regler, en række trin, der er nedskrevet og nøjagtigt fulgt. Alligevel kan der være en vis skævhed i stikprøven. Tag f.eks. problemet med at udforme en stikprøve med henblik på at forudsige resultatet af en valgundersøgelse. Alle kendte metoder har deres problemer, og valgresultaterne er ofte forskellige fra de forudsigelser, der er baseret på en stikprøve. Hvis man indsamler meninger ved hjælp af telefoner eller ved at møde folk på gaden, vil man ikke spørge folk, der ikke besvarer telefonopkald, eller som ikke går på gaden. Derfor er det i tilfælde som dette aldrig muligt at få en fuldstændig neutral stikprøve. I sådanne tilfælde vil en statistiker overveje, hvordan man kan måle omfanget af bias, og der er måder at estimere dette på.
En lignende situation opstår, når forskere måler en fysisk egenskab, f.eks. vægten af et stykke metal eller lysets hastighed. Hvis vi vejer en genstand med følsomt udstyr, vil vi få meget forskellige resultater. Intet målesystem er nogensinde perfekt. Vi får en række skøn, og hvert skøn er en måling. Det er stikprøver med en vis grad af fejl. Statistik er beregnet til at beskrive fejl og foretage analyser af denne type data.
Der findes forskellige former for prøver:
- En komplet prøve omfatter alle de elementer, der har en given egenskab.
- En uvildig eller repræsentativ prøve fremstilles ved at tage en komplet prøve og udvælge elementer fra den i en proces, der ikke afhænger af elementernes egenskaber.
Den måde, hvorpå stikprøven er udtaget, og stikprøvens størrelse har betydning for, hvordan dataene opfattes.
Grænsepolitiet leder efter ulovlige stoffer med en specialtrænet hund: Hvis de kontrollerer hver tiende bil, tager de en uvildig stikprøve.
Stratificeret stikprøveudtagning
Hvis en population har åbenlyse delpopulationer, skal hver enkelt delpopulation udtages som prøve. Dette kaldes stratificeret stikprøveudtagning. Stratificeret stikprøveudtagning er også kendt som stratificeret tilfældig stikprøve. Stratificeret stikprøveudtagning repræsenteres ofte som en andel, f.eks. som procent (%).
Lad os antage, at et eksperiment har til formål at undersøge voksnes indkomster. Det er klart, at indkomsterne for universitetsuddannede kan være forskellige fra indkomsterne for ikke-uddannede. Lad os nu antage, at antallet af mandlige akademikere udgjorde 30 % af alle mandlige voksne (tænkt tal). Så ville man sørge for, at 30 % af den samlede stikprøve var mandlige akademikere, der blev udvalgt tilfældigt, og at 70 % af den samlede stikprøve var mandlige ikke-uddannede akademikere. Gentag processen for kvinder, fordi procentdelen af kvindelige kandidater er forskellig fra mandlige kandidater. Det giver en stikprøve af den voksne befolkning stratificeret efter køn og universitetsuddannelse. Det næste skridt er at opdele hver af dine delpopulationer efter aldersgrupper, fordi (f.eks.) akademikere kan opnå større indkomst i forhold til ikke-uddannede i den midaldrende alder.
En anden type stratificeret stikprøve omhandler variation. Her udtages større stikprøver fra de mere varierende delpopulationer, således at de sammenfattende statistikker, såsom gennemsnit og standardafvigelser, er mere pålidelige.
Spørgsmål og svar
Q: Hvad er en stikprøve i statistik?
A: I statistik er en stikprøve en del af en population, som er blevet omhyggeligt udvalgt for at repræsentere hele populationen retfærdigt og uden skævheder.
Q: Hvorfor er der brug for stikprøver?
A: Der er brug for stikprøver, fordi populationer kan være så store, at det ikke er muligt eller praktisk muligt at tælle alle individer. Derfor starter løsningen af et problem inden for statistik normalt med stikprøver.
Spørgsmål: Hvordan er en stikprøve repræsenteret?
Svar: Når en stikprøve behandles som et datasæt, repræsenteres den ofte med store bogstaver som X og Y, mens dens elementer repræsenteres med små bogstaver (f.eks. x3), og stikprøvens størrelse repræsenteres med bogstavet n.
Spørgsmål: Hvad skal stikprøver være?
A: Som en generel regel skal stikprøverne være tilfældige, hvilket betyder, at chancen eller sandsynligheden for at udvælge et individ er den samme som chancen for at udvælge ethvert andet individ. I praksis udtages tilfældige stikprøver altid ved hjælp af en veldefineret procedure.
Spørgsmål: Kan der fortsat være skævheder i stikprøver?
Svar: Selv når der anvendes veldefinerede procedurer for stikprøveudtagning, kan der være en vis skævhed i stikprøven på grund af faktorer som f.eks. hvem der besvarer telefonopkald, eller hvem der går i bestemte gader, når der indsamles holdninger til en valgprognose. I sådanne tilfælde kan det være vanskeligt at få helt neutrale stikprøver, men statistikere kan måle, hvor meget skævhed der stadig er til stede.
Spørgsmål: Er der forskellige former for stikprøver?
A: Ja, der findes forskellige former for stikprøver, herunder fuldstændige stikprøver, som omfatter alle elementer, der har bestemte egenskaber, og upartiske/repræsentative stikprøver, som indebærer udvælgelse af elementer fra fuldstændige stikprøver uden at tage hensyn til deres egenskaber. Den måde, hvorpå stikprøverne udtages, og deres størrelse har betydning for, hvordan dataene betragtes.