Inden for sandsynlighed og statistik er en sandsynlighedstæthedsfunktion en funktion, der karakteriserer enhver kontinuerlig sandsynlighedsfordeling. For en tilfældig variabel X skrives sandsynlighedsdensitetsfunktionen for X undertiden som . Integralet af sandsynlighedsdensitetsfunktionen i intervallet
giver sandsynligheden for, at en given tilfældig variabel med den givne tæthed er indeholdt i det angivne interval. Sandsynlighedsdensitetsfunktionen er pr. definition ikke-negativ i hele sit område, hvor integralet summerer til 1.
Definition og fortolkning
En sandsynlighedstæthedsfunktion (pdf) f_X(x) for en kontinuerlig tilfældig variabel X opfylder to grundlæggende krav:
- f_X(x) ≥ 0 for alle x.
- ∫_{-∞}^{∞} f_X(x) dx = 1.
Fortolkningen er: sandsynligheden for, at X ligger i et interval [a,b], beregnes som integralet
P(a ≤ X ≤ b) = ∫_a^b f_X(x) dx.
Bemærk, at sandsynligheden for præcis ét punkt er 0 for en kontinuerlig fordeling: P(X = x0) = 0 for alle x0.
Egenskaber og sammenhæng med fordelingsfunktionen
- Kumulativ fordelingsfunktion (cdf): F_X(x) = P(X ≤ x) = ∫_{-∞}^x f_X(t) dt. Ved at differentiere cdf'en (hvor den er differentiabel) får man pdf'en: f_X(x) = F'_X(x).
- Forventning og varians (når de eksisterer):
- E[X] = ∫_{-∞}^{∞} x f_X(x) dx.
- Var(X) = ∫_{-∞}^{∞} (x - E[X])^2 f_X(x) dx = E[X^2] - (E[X])^2.
- Transformation: Hvis Y = g(X) og g er en differentiabel, invertibel funktion, så kan tætheden for Y findes som f_Y(y) = f_X(x) · |dx/dy|, hvor x = g^{-1}(y).
- Linearkombinationer: For lineære transformationer Y = aX + b gælder f_Y(y) = (1/|a|) f_X((y - b)/a).
Typiske fordelingseksempler
- Uniform på [a,b]:
f_X(x) = 1/(b - a) for x ∈ [a,b], og 0 ellers. Her er sandsynligheden for et underinterval proportional med dets længde.
- Normalfordelingen N(μ, σ^2):
f_X(x) = (1 / (√(2π) σ)) · exp(−(x − μ)^2 / (2σ^2)), for x ∈ ℝ. Normalfordelingen er kontinuerlig, symmetrisk om μ og karakteriseret ved middelværdi μ og standardafvigelse σ.
- Eksponentialfordelingen (λ > 0):
f_X(x) = λ e^{−λ x} for x ≥ 0, og 0 ellers. Bruges ofte til at modellere ventetider mellem uafhængige hændelser.
Praktiske bemærkninger og faldgruber
- Man må ikke forveksle tæthed med sandsynlighed — tætheden er et mål pr. enheds længde; sandsynligheder fås ved integraler over intervaller.
- I nogle situationer forekommer blandede fordelinger, hvor der både er et diskret masser (atomiske sandsynligheder) og en kontinuert tæthed. Disse beskrives ikke fuldstændigt af en almindelig pdf alene.
- Der findes også singulære fordelinger (f.eks. Cantor-fordelingen) og tilfælde med tæthed repræsenteret formelt ved en Dirac-delta (bruges som notation for punktmasse), men disse kræver særlig behandling.
- Kontrollér enhed og skala: tætheder kan antage meget store eller små tal afhængig af måleenheder; kun integralerne har direkte probabilistisk mening.
Beregning i praksis
- For numeriske beregninger bruges ofte analytiske integraler, tabelopslag (fx for normalfordelingen) eller numeriske metoder (Simpson, quadrature) samt Monte Carlo-simulering.
- Ved modellering bør man vælge en families af fordelinger, der passer til dataens egenskaber (symmetri, haleadfærd, understøttet interval osv.).
Opsummering
Sandsynlighedstæthedsfunktionen f_X(x) beskriver, hvordan sandsynligheden er fordelt over værdierne af en kontinuerlig tilfældig variabel. Den er ikke-negativ, integrerer til 1, og sandsynligheder over intervaller opnås ved at integrere f_X over disse intervaller. Forståelse af pdf'ens egenskaber og relationer til cdf, forventning og transformationer er central i anvendt sandsynlighedsmodelering og statistik.

