Inden for sandsynlighed og statistik er en sandsynlighedstæthedsfunktion en funktion, der karakteriserer enhver kontinuerlig sandsynlighedsfordeling. For en tilfældig variabel X skrives sandsynlighedsdensitetsfunktionen for X undertiden som {\displaystyle f_{X}(x)} . Integralet af sandsynlighedsdensitetsfunktionen i intervallet {\displaystyle [a,b]} giver sandsynligheden for, at en given tilfældig variabel med den givne tæthed er indeholdt i det angivne interval. Sandsynlighedsdensitetsfunktionen er pr. definition ikke-negativ i hele sit område, hvor integralet summerer til 1.




 

Definition og fortolkning

En sandsynlighedstæthedsfunktion (pdf) f_X(x) for en kontinuerlig tilfældig variabel X opfylder to grundlæggende krav:

  • f_X(x) ≥ 0 for alle x.
  • ∫_{-∞}^{∞} f_X(x) dx = 1.

Fortolkningen er: sandsynligheden for, at X ligger i et interval [a,b], beregnes som integralet

P(a ≤ X ≤ b) = ∫_a^b f_X(x) dx.

Bemærk, at sandsynligheden for præcis ét punkt er 0 for en kontinuerlig fordeling: P(X = x0) = 0 for alle x0.

Egenskaber og sammenhæng med fordelingsfunktionen

  • Kumulativ fordelingsfunktion (cdf): F_X(x) = P(X ≤ x) = ∫_{-∞}^x f_X(t) dt. Ved at differentiere cdf'en (hvor den er differentiabel) får man pdf'en: f_X(x) = F'_X(x).
  • Forventning og varians (når de eksisterer):
    • E[X] = ∫_{-∞}^{∞} x f_X(x) dx.
    • Var(X) = ∫_{-∞}^{∞} (x - E[X])^2 f_X(x) dx = E[X^2] - (E[X])^2.
  • Transformation: Hvis Y = g(X) og g er en differentiabel, invertibel funktion, så kan tætheden for Y findes som f_Y(y) = f_X(x) · |dx/dy|, hvor x = g^{-1}(y).
  • Linearkombinationer: For lineære transformationer Y = aX + b gælder f_Y(y) = (1/|a|) f_X((y - b)/a).

Typiske fordelingseksempler

  • Uniform på [a,b]:

    f_X(x) = 1/(b - a) for x ∈ [a,b], og 0 ellers. Her er sandsynligheden for et underinterval proportional med dets længde.

  • Normalfordelingen N(μ, σ^2):

    f_X(x) = (1 / (√(2π) σ)) · exp(−(x − μ)^2 / (2σ^2)), for x ∈ ℝ. Normalfordelingen er kontinuerlig, symmetrisk om μ og karakteriseret ved middelværdi μ og standardafvigelse σ.

  • Eksponentialfordelingen (λ > 0):

    f_X(x) = λ e^{−λ x} for x ≥ 0, og 0 ellers. Bruges ofte til at modellere ventetider mellem uafhængige hændelser.

Praktiske bemærkninger og faldgruber

  • Man må ikke forveksle tæthed med sandsynlighed — tætheden er et mål pr. enheds længde; sandsynligheder fås ved integraler over intervaller.
  • I nogle situationer forekommer blandede fordelinger, hvor der både er et diskret masser (atomiske sandsynligheder) og en kontinuert tæthed. Disse beskrives ikke fuldstændigt af en almindelig pdf alene.
  • Der findes også singulære fordelinger (f.eks. Cantor-fordelingen) og tilfælde med tæthed repræsenteret formelt ved en Dirac-delta (bruges som notation for punktmasse), men disse kræver særlig behandling.
  • Kontrollér enhed og skala: tætheder kan antage meget store eller små tal afhængig af måleenheder; kun integralerne har direkte probabilistisk mening.

Beregning i praksis

  • For numeriske beregninger bruges ofte analytiske integraler, tabelopslag (fx for normalfordelingen) eller numeriske metoder (Simpson, quadrature) samt Monte Carlo-simulering.
  • Ved modellering bør man vælge en families af fordelinger, der passer til dataens egenskaber (symmetri, haleadfærd, understøttet interval osv.).

Opsummering

Sandsynlighedstæthedsfunktionen f_X(x) beskriver, hvordan sandsynligheden er fordelt over værdierne af en kontinuerlig tilfældig variabel. Den er ikke-negativ, integrerer til 1, og sandsynligheder over intervaller opnås ved at integrere f_X over disse intervaller. Forståelse af pdf'ens egenskaber og relationer til cdf, forventning og transformationer er central i anvendt sandsynlighedsmodelering og statistik.