Loven om store tal (LLN) er et teorem fra statistikken. Overvej en proces, hvor der forekommer tilfældige resultater — for eksempel når en tilfældig variabel observeres gentagne gange under de samme betingelser. Så vil gennemsnittet af de observerede værdier være stabilt i det lange løb: det betyder, at gennemsnittet af de observerede værdier kommer stadig tættere på den forventede værdi, efterhånden som antallet af observationer vokser.
Hvad siger LLN præcist?
En kort, formel version af udsagnet er:
Hvis X1, X2, ..., Xn er uafhængige og identisk fordelte (i.i.d.) tilfældige variable med endelig forventet værdi E[X], så konvergerer prøve-gennemsnittet
(1/n) Σ_{i=1}^n X_i
mod E[X] når n → ∞.
Der findes to almindelige varianter af LLN:
- Svag (weak) LLN: prøve-gennemsnittet konvergerer i sandsynlighed mod forventningen.
- Stærk (strong) LLN: prøve-gennemsnittet konvergerer næsten sikkert (dvs. med sandsynlighed 1) mod forventningen.
Begge varianter kræver typisk nogle betingelser, fx uafhængighed eller svage afhængighedsstrukturer og en begrænsning på forventningen (ofte også begrænsning af variansen for enklere versioner).
Eksempel: terningkast
Når du kaster terninger, er tallene 1, 2, 3, 4, 5 og 6 mulige resultater. De er alle lige sandsynlige. Befolkningsgennemsnittet (eller den "forventede værdi") af resultaterne er:
(1 + 2 + 3 + 4 + 5 + 6) / 6 = 3.5.
I praksis vil gennemsnittet af et lille antal kast variere meget fra kast til kast. Men hvis du bliver ved med at kaste terningen og løbende beregner gennemsnittet af alle kastene, vil dette gennemsnit — som forudsagt af LLN — nærme sig 3,5. I starten ser man store udsving, men efterhånden som antallet af observationer bliver stort, stabiliserer gennemsnittet sig.

Begrænsninger og misforståelser
- LLN garanterer ikke hurtigt konvergens: den siger kun, at gennemsnittet nærmer sig forventningen når n bliver meget stor. Hvor hurtigt det sker afhænger af variansen og andre faktorer.
- Ingen "retablering" af enkeltstående hændelser: hvis du får mange gange "6" i træk, betyder LLN ikke, at du nu er "pålidelig" til at få fåere 6'ere efterfølgende — hver ny kast er stadig tilfældigt (hvis kasten er uafhængig).
- Kræver ikke altid i.i.d.: der findes versioner af LLN for svagt afhængige variable, men for at bruge den enkleste version skal variable typisk være uafhængige og identisk fordelte.
- Ikke gyldig ved uendelig forventning: hvis den tilfældige variabel ikke har en endelig forventning (fx ekstremt tunge fordelinger), gælder den almindelige LLN ikke nødvendigvis.
Betydning og anvendelser
- Grundlaget for empirisk statistik: prøvegennemsnit bruges som estimatorer for populationens gennemsnit.
- Vigtig i statistik, finans, forsikring, kvalitetskontrol, maskinlæring og eksperimentel videnskab — overalt hvor man estimerer forventede værdier fra gentagne målinger.
- Forklarer hvorfor store stikprøver giver mere pålidelige estimater: jo flere observationer, desto tættere forventes gennemsnittet at ligge ved den sande værdi.
Forbindelse til andre resultater
- Central Limit Theorem (CLT): mens LLN siger, at gennemsnittet konvergerer mod forventningen, beskriver CLT hvordan afvigelserne afprøvegennemsnittet omkring forventningen fordeler sig (typisk cirka normalfordelt for store n og finite variance).
- Store tal og risiko: i forsikring betyder LLN, at med tilstrækkeligt mange uafhængige kunder kan et selskab forudsige gennemsnitlige tab rimeligt præcist.
En kort bevisidé
Bevisene bygger ofte på to ting: at summen af uafhængige, centrerede variable vokser mindre end lineært i forhold til n (ofte kontrolleret via varians), og at sandsynligheden for store afvigelser derfor går mod nul. Den stærke version bruger typisk mere avancerede værktøjer (fx Borel–Cantelli-lemmaet) til at opnå næsten sikker konvergens.
Praktiske råd
- Vær klar over antagelserne: tjek om dine observationer kan antages uafhængige og identisk fordelte eller om afhængighed/ændringer i processen gør LLN mindre relevant.
- Brug LLN som heuristik: den fortæller, at flere målinger typisk forbedrer estimatet, men mål præcist hvor mange observationer der er nødvendige (fx via konfidensintervaller/CLT).
Opsummeret: Loven om store tal er et centralt teoretisk værktøj, der forklarer, hvorfor gennemsnit fra gentagne forsøg bliver stabile og pålidelige, når antallet af observationer er stort. Forståelse af betingelserne og begrænsningerne er vigtig, når du anvender LLN i praksis.