I statistik er en stikprøve en del af en population. Prøven er omhyggeligt udvalgt. Den skal repræsentere hele populationen retfærdigt og uden skævheder.
Når en stikprøve behandles som et datasæt, repræsenteres den ofte med store bogstaver som og
, mens dens elementer repræsenteres med små bogstaver (f.eks.
stikprøvens størrelse repræsenteres med bogstavet
.
Grunden til, at der er behov for stikprøver, er, at populationerne kan være så store, at det ikke er muligt eller praktisk muligt at tælle alle individer. Derfor starter løsningen af et problem i statistikken normalt med stikprøver. Stikprøveudtagning handler om at vælge, hvilke data der skal udtages med henblik på senere analyse. Lad os som eksempel antage, at forureningen af en sø skal analyseres med henblik på en undersøgelse. Afhængigt af, hvor vandprøverne er taget, kan undersøgelserne give forskellige resultater.
Som en generel regel skal stikprøverne være tilfældige. Det betyder, at chancen eller sandsynligheden for at udvælge et individ er den samme som chancen for at udvælge ethvert andet individ.
I praksis udtages stikprøver altid efter en veldefineret procedure. En procedure er et sæt regler, en række trin, der er nedskrevet og nøjagtigt fulgt. Alligevel kan der være en vis skævhed i stikprøven. Tag f.eks. problemet med at udforme en stikprøve med henblik på at forudsige resultatet af en valgundersøgelse. Alle kendte metoder har deres problemer, og valgresultaterne er ofte forskellige fra de forudsigelser, der er baseret på en stikprøve. Hvis man indsamler meninger ved hjælp af telefoner eller ved at møde folk på gaden, vil man ikke spørge folk, der ikke besvarer telefonopkald, eller som ikke går på gaden. Derfor er det i tilfælde som dette aldrig muligt at få en fuldstændig neutral stikprøve. I sådanne tilfælde vil en statistiker overveje, hvordan man kan måle omfanget af bias, og der er måder at estimere dette på.
En lignende situation opstår, når forskere måler en fysisk egenskab, f.eks. vægten af et stykke metal eller lysets hastighed. Hvis vi vejer en genstand med følsomt udstyr, vil vi få meget forskellige resultater. Intet målesystem er nogensinde perfekt. Vi får en række skøn, og hvert skøn er en måling. Det er stikprøver med en vis grad af fejl. Statistik er beregnet til at beskrive fejl og foretage analyser af denne type data.
Der findes forskellige former for prøver:
- En komplet prøve omfatter alle de elementer, der har en given egenskab.
- En uvildig eller repræsentativ prøve fremstilles ved at tage en komplet prøve og udvælge elementer fra den i en proces, der ikke afhænger af elementernes egenskaber.
Den måde, hvorpå stikprøven er udtaget, og stikprøvens størrelse har betydning for, hvordan dataene opfattes.
Typer af stikprøver (oversigt)
Ud over de to grundlæggende ideer om en komplet prøve (census) og en repræsentativ prøve findes flere konkrete metoder til stikprøveudtagning. Valget afhænger af formålet, populationens struktur og praktiske hensyn.
- Tilfældig (simpel tilfældig) stikprøve: Hvert individ i populationen har samme chance for at blive udvalgt. Velegnet, når man har en komplet liste over populationen.
- Stratificeret stikprøve: Populationen opdeles i undergrupper (strata) med fælles karakteristika (fx alder, køn, region). Fra hvert strata trækkes en tilfældig stikprøve. Øger præcisionen ved heterogene populationer.
- Klyngeudtagning (cluster sampling): Populationen opdeles i klynger (fx skoler, bydele). Nogle klynger udvælges tilfældigt, og alle eller et udvalg af elementer i de valgte klynger måles. Praktisk, når det er dyrt at trække enkle tilfældige stikprøver.
- Systematisk stikprøve: Et startpunkt vælges tilfældigt, herefter med faste intervaller (fx hver 10.). Simpelt at gennemføre, men kan give skævhed hvis der er periodiske mønstre i listen.
- Bekvemmelighedsstikprøve (convenience sampling): Udvalg baseret på nem adgang (fx online-respondenter). Hurtigt og billigt, men ofte ikke repræsentativt.
- Sneboldstikprøve: Bruges for svære-at-nå populationer: de første deltagere henviser nye. Kan være nyttig, men kan give stærk selektionsskævhed.
Repræsentativitet og bias
Repræsentativitet betyder, at stikprøven afspejler populationens vigtigste karakteristika, så konklusioner kan generaliseres. Flere typer fejl kan true repræsentativiteten:
- Udvalgsbias (selection bias): Opstår når chancen for at blive udvalgt varierer mellem individer (fx telefonundersøgelse uden mobilnumre).
- Ikke-svar (non-response bias): Når mange udvalgte ikke svarer, og ikke-svarerne adskiller sig systematisk fra svarerne.
- Målefejl (measurement error): Fejl i selve målingen eller i spørgeskemaet, som kan fordreje resultaterne.
- Observatørfejl: Forskellig registrering mellem målere/instrumenter.
Statistikere forsøger at minimere bias gennem omhyggelig design, vægtning (post-stratifikation), opfølgende indsats for at reducere ikke-svar og ved at måle størrelsen af eventuel bias, så resultater kan justeres eller fortolkes korrekt.
Stikprøvestørrelse og usikkerhed
Et centralt spørgsmål er, hvor stort et n (stikprøvestørrelsen) skal være. Generelt gælder:
- Større stikprøver giver mindre statistisk usikkerhed (mindre standardfejl). For mange estimater skalerer usikkerheden med 1/√n: for at halvere usikkerheden skal stikprøven være fire gange større.
- For andele og middelværdier kan man beregne en forventet usikkerhed (fx margin of error) ud fra variabiliteten i populationen og ønsket konfidensniveau.
- Praktiske faktorer (tid, penge, adgang) påvirker ofte det realistiske valg af n.
Desuden er det vigtigt at skelne mellem tilfældig fejl (sampling error), som kan kvantificeres og mindskes ved større n, og systematisk fejl (bias), som ikke nødvendigvis bliver mindre med større n.
Statistiske principper der hjælper
- Konfidensintervaller: Angiver et interval, hvor vi med en given sikkerhed forventer at finde populationsparameteren baseret på stikprøven.
- Centralgrænseværdien (Central Limit Theorem): For store nok stikprøver vil fordelingen af stikprøvegennemsnittet nærme sig en normalfordeling, hvilket gør inferens (fx tests og konfidensintervaller) lettere.
- Standardfejl: Et mål for, hvor meget et estimat forventes at variere mellem forskellige tilfældige stikprøver.
Praktiske råd til god stikprøvepraksis
- Definér populationen klart fra starten: hvem og hvad skal undersøges?
- Vælg en udtagningsmetode, der passer til populationens opbygning og undersøgelsens mål (fx stratificeret hvis undergrupper er vigtige).
- Dokumentér proceduren: hvordan blev stikprøven trukket, hvilke kriterier, hvilke afvisninger/ikke-svar?
- Planlæg tiltag mod ikke-svar: påmindelser, incitamenter, alternative kontaktformer.
- Overvej vægtning efter udtagning, hvis stikprøven afviger fra kendte populationsegenskaber.
- Brug pilotundersøgelser til at estimere varians og beregne nødvendig stikprøvestørrelse.
Eksempel — måling af forurening i en sø
I eksemplet med forurening af en sø er sted, dybde og tidspunkt for prøvetagning vigtige beslutninger. En repræsentativ strategi kan være:
- Stratificering efter dybdezoner og afstand fra kilder til forurening.
- Tilfældig udtagning af målepunkter inden for hvert strata.
- Gentagne prøver over tid for at fange sæsonvariation og reducere målefejl.
Hvis man i stedet kun tager prøver tæt på den nemmeste adgangsvej, risikerer man et systematisk skævt estimat af forureningsniveauet.
Afsluttende bemærkninger
Stikprøver er fundamentet i empirisk statistik. God stikprøveudtagning kræver både teoretisk forståelse (hvordan man kvantificerer usikkerhed og bias) og praktisk planlægning (hvordan data indsamles i felten). Når metoderne dokumenteres og potentielle skævheder adresseres, bliver resultaterne mere pålidelige og anvendelige i beslutningsprocesser.

