Gumbel-fordelingen er en sandsynlighedsfordeling af ekstreme værdier.

I sandsynlighedsregning og statistik anvendes Gumbel-fordelingen til at modellere fordelingen af maksimum (eller minimum) af et antal prøver af forskellige fordelinger.

En sådan fordeling kan bruges til at repræsentere fordelingen af det maksimale vandspejl i en flod i et bestemt år, hvis der findes en liste over maksimumsværdier for de seneste ti år. Den er også nyttig til at forudsige chancen for, at et ekstremt jordskælv, en oversvømmelse eller en anden naturkatastrofe vil indtræffe.

 

Definition og formler

Gumbel-fordelingen beskriver typisk fordelingen af blokmaksima (f.eks. årlige maksimumsværdier). Den har to parametre: location μ og scale β > 0. Når man sætter z = (x − μ) / β, er fordelingsfunktion (CDF) og tæthed (PDF):

  • F(x) = exp(−e^{−z}) = exp(−e^{−(x−μ)/β})
  • f(x) = (1/β) e^{−z} e^{−e^{−z}} = (1/β) exp(−(x−μ)/β − e^{−(x−μ)/β})

Gumbel for maksimum kaldes ofte Gumbel‑right (eller gumbel_r). For minimum spejles fordelingsfunktionen (gumbel_l).

Vigtige egenskaber

  • Forventning: E[X] = μ + γ β, hvor γ ≈ 0,5772156649 er Euler–Mascheroni‑konstanten.
  • Varians: Var(X) = (π^2 / 6) β^2.
  • Median: x_{0.5} = μ − β ln(ln 2).
  • Skævhed (skewness) og andre højere momenter er konstante (uafhængige af μ og β) — skævheden er ≈ 1,139547.
  • Gumbel er en særlig case af Generalized Extreme Value (GEV)‑fordelingen med shape parameter ξ = 0.

Anvendelser

Gumbel-fordelingen anvendes bredt i situationer, hvor man interesserer sig for ekstreme hændelser:

  • Hydrologi: årlige maksimumsvandstande, flodtoppe og design af diger.
  • Meteorologi: maksimum vindhastigheder, ekstreme nedbørshændelser.
  • Ingeniørvidenskab: last‑ og styrkeberegninger ved ekstreme belastninger.
  • Geofysik: sandsynlighed for store jordskælv eller tsunamier.
  • Forsikring og finans: modellering af ekstreme tab eller risikobegivenheder.

Return‑niveauer (designværdier)

Et hyppigt anvendt begreb er T‑års return‑niveauet x_T, det niveau som forventes overskredet med sandsynlighed 1/T i et givet år. For Gumbel er kvantilen ved sandsynlighed p givet ved

x_p = μ − β ln(−ln p).

Hvis p = 1 − 1/T, fås T‑års return‑niveau:

x_T = μ − β ln(−ln(1 − 1/T)).

Eksempel: Hvis μ = 10 og β = 2, er 100‑års return‑niveau cirka x_100 ≈ 10 − 2·ln(−ln 0.99) ≈ 19.2.

Estimation og modelvalg

  • MLE (Maximum Likelihood) anvendes ofte til at estimere μ og β numerisk.
  • Metode af momenter kan bruges som en simpel tilgang; L‑momenter er populære i hydrologi, fordi de er robuste over for ekstreme værdier.
  • Ved lille datamængde eller afhængighed i data (f.eks. serieafhængighed) bør man være forsigtig: blok‑maksima‑metoden kræver typisk uafhængighed og stationaritet.
  • Modelvalidering: QQ‑plots, PP‑plots, Kolmogorov–Smirnov, Anderson–Darling og likelihood‑baserede tests bruges til at kontrollere tilpasning.

Begrænsninger og antagelser

  • Gumbel antager, at blokmaksima konvergerer mod en GEV med ξ = 0. Hvis data er tungere halet, kan Fréchet (ξ > 0) være mere passende, og for lettere haler vælges Weibull (ξ < 0).
  • Blok‑maksima‑metoden bruger kun maksimumsværdier fra hver blok (fx år), så meget information går tabt sammenlignet med peaks‑over‑threshold (POT) metoder, der bruger Generalized Pareto Distribution.
  • Antagelser om stationaritet (ingen trend) og uafhængighed mellem blokke skal vurderes; ved klimatiske trends skal man inkludere tidsafhængige parametre eller anvende ikke‑stationære modeller.

Praktisk brug og software

  • R: pakker som evd, ismev, extRemes og fitdistrplus tilbyder funktioner til tilpasning og diagnosticering.
  • Python: scipy.stats.gumbel_r og scipy.stats.gumbel_l kan bruges til tæthed, fordelingsfunktion og simulering; avancerede ekstrem‑pakker findes også i eksterne biblioteker.

Opsummering

Gumbel‑fordelingen er et praktisk og ofte anvendt værktøj i ekstremværdestatistik til at beskrive fordelingen af blokmaksima. Den er let at anvende, har velkendte analytiske egenskaber og giver en enkel måde at beregne return‑niveauer på. Samtidig er det vigtigt at kontrollere antagelserne og overveje alternative ekstremmodeller, når data viser tungere eller lettere haler end Gumbel‑case'en.