Inden for matematik og statistik er Spearmans rangkorrelationskoefficient et mål for korrelation, opkaldt efter dens ophavsmand, Charles Spearman. Det skrives kort som det græske bogstav rho ( ρ {\displaystyle \rho } ) eller nogle gange som r s {\displaystyle r_{s}}
. Det er et tal, der viser, hvor tæt to datasæt er forbundet. Det kan kun anvendes til data, der kan ordnes i rækkefølge, f.eks. fra højeste til laveste værdi.
Den generelle formel for r s {\displaystyle r_{s}}} er ρ = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle \rho =1-{\cfrac {6\cfrac {6\sum d^{2}}}{n(n^{{2}-1)}}}}
.
Hvis du f.eks. har data for, hvor dyre forskellige computere er, og data for, hvor hurtige computerne er, kan du se, om de er forbundet, og hvor tæt de er forbundet, ved hjælp af r s {\displaystyle r_{s}} .
Hvad måler Spearmans ρ?
Spearmans rangkorrelation måler styrken og retningen af en monoton sammenhæng mellem to variable. Det vil sige, om én variabel typisk stiger når den anden stiger (positiv korrelation), eller falder når den anden stiger (negativ korrelation). Metoden kræver kun, at data kan ordnes (rangordnes) og er derfor ikke afhængig af lineæritet eller af de egentlige måleenheder.
Trinvis beregning
En enkel fremgangsmåde for at beregne ρ er:
- 1) Rangordn værdierne i hvert datasæt separat (mindst til størst eller omvendt).
- 2) For hver observation beregn forskellen d mellem de to rangordener (rang_X − rang_Y).
- 3) Kvadrér disse forskelle og summer: ∑ d².
- 4) Indsæt i formlen: ρ = 1 − (6 ∑ d²) / (n (n² − 1)), hvor n er antallet af observationer.
Håndtering af lige rækker (ties)
Hvis der er identiske værdier (ties), tildeles hver identisk værdi middelrangen. For eksempel, hvis to observationer deler 2. og 3. plads, får begge rang 2,5. Formlen med 6∑d² giver stadig et brugbart resultat, når man giver middelrækker, men hvis der er mange ties kan man i praksis beregne Spearmans ρ ved først at erstatte de oprindelige værdier med deres rækker og derefter beregne Pearson-korrelationen på disse rækker — dette håndterer ties korrekt i de fleste softwarepakker. For meget store mængder ties kan eksakte p‑værdier kræve specielformler eller permutationstest.
Fortolkning
- ρ = +1: Perfekt stigende monoton sammenhæng (rangerne er identiske).
- ρ = −1: Perfekt faldende monoton sammenhæng (rangerne er præcist omvendte).
- ρ ≈ 0: Ingen monoton sammenhæng (der kan dog stadig være en ikke‑monoton relation).
Størrelsen af ρ angiver styrken af den monotone sammenhæng, men hvad der er "stor" afhænger af konteksten og stikprøvestørrelsen.
Signifikans og test
For små prøver kan man bruge eksakte test (permutationsfordeling) for at beregne p‑værdien for ρ under nulhypotesen om ingen sammenhæng. For større prøver anvendes ofte en tilnærmelse, og mange statistiske programmer angiver p‑værdier ud fra asymptotiske fordelinger. En praktisk tilgang er at bruge en permutationstest, hvis man ønsker en præcis p‑værdi uden stærke fordelingsantagelser.
Eksempel
Antag vi har 5 computere med priser (i tusinde kr.) og hastigheder (benchmark):
- Pris: 8, 12, 10, 6, 14
- Hastighed: 200, 320, 280, 150, 400
Rækker for pris: 2, 4, 3, 1, 5. Rækker for hastighed: 2, 4, 3, 1, 5. Her er rangene identiske, så d = 0 for hver observation og ∑d² = 0 → ρ = 1, hvilket indikerer en perfekt stigende monoton sammenhæng mellem pris og hastighed i dette eksempel.
Hvornår skal man vælge Spearman frem for Pearson?
- Brug Spearman når du er interesseret i monotone sammenhænge, eller når data ikke opfylder krav om normalfordeling og linearitet.
- Brug Pearson når du specifikt ønsker at måle lineær sammenhæng mellem to kontinuerte, omtrent normalfordelte variable uden mange outliers.
Begrænsninger
Spearmans ρ fanger kun monotone sammenhænge — hvis forholdet mellem variabler er ikke‑monotont (f.eks. kurveformet), kan ρ være tæt på nul selvom variablerne er stærkt afhængige. Desuden reducerer rangtransformeringen information om størrelsesforholdene mellem værdierne (kun orden bevares), hvilket kan være en fordel eller ulempe afhængig af analyseformålet.
Anvendelser
Spearmans korrelation bruges bredt inden for biologiske og samfundsvidenskabelige studier, psykologi, økologi og overalt hvor data er ordinal eller hvor antagelserne for Pearson ikke er opfyldte. Den er også velegnet som et robust alternativ ved tilstedeværelse af outliers.
Hvis du vil beregne Spearmans ρ i praksis kan du bruge statistikprogrammer som R, Python (scipy.stats.spearmanr), eller almindelige statistikpakker — de håndterer rangordning og ties automatisk og tilbyder ofte både koefficient og signifikans (p‑værdi).