Korrelation

I statistik og sandsynlighedsregning betyder korrelation, hvor tæt to datasæt er forbundet.

Korrelation betyder ikke altid, at det ene er årsag til det andet. Det er meget muligt, at der er en tredje faktor involveret.

Korrelationen har normalt en af to retninger. Disse er positive eller negative. Hvis den er positiv, stiger de to sæt sammen. Hvis den er negativ, stiger den ene, mens den anden falder.

Der anvendes mange forskellige målinger af korrelation i forskellige situationer. På et spredningsdiagram tegner man f.eks. en linje med bedste tilpasning for at vise retningen af sammenhængen.

Denne spredningsdiagram har positiv korrelation. Det kan man se, fordi tendensen går opad og til højre. Den røde linje er en linje med den bedste tilpasning.

Forklaring af korrelation

Stærk og svag er ord, der bruges til at beskrive korrelation. Hvis der er en stærk korrelation, ligger punkterne tæt på hinanden. Hvis der er en svag korrelation, er punkterne spredt fra hinanden. Der er måder at få tal til at vise, hvor stærk korrelationen er. Disse målinger kaldes korrelationskoefficienter. Den mest kendte er Pearson-produkt-momentkorrelationskoefficienten. Man indtaster data i en formel, og den giver et tal. Hvis tallet er 1 eller -1, er der en stærk korrelation. Hvis svaret er 0, er der ingen korrelation. En anden form for korrelationskoefficient er Spearmans rangkorrelationskoefficient.

Korrelation vs. årsagssammenhæng

Korrelation betyder ikke altid, at den ene ting er årsag til den anden ting (årsagssammenhæng), fordi noget andet kan have forårsaget begge ting. F.eks. køber folk is på varme dage, og folk går også på stranden, hvor nogle bliver ædt af hajer. Der er en sammenhæng mellem salget af is og hajangreb (i dette tilfælde stiger begge dele i takt med, at temperaturen stiger). Men bare fordi salget af is stiger, betyder det ikke, at salget af is forårsager (kausalitet) flere hajangreb eller omvendt.

Fordi korrelation ikke er ensbetydende med årsagssammenhæng, vil videnskabsmænd, økonomer osv. teste deres teorier ved at skabe isolerede miljøer, hvor kun én faktor ændres (hvor dette er muligt). Men politikere, sælgere, nyhedsbureauer og andre antyder ofte, at en bestemt korrelation indebærer årsagssammenhæng. Dette kan skyldes uvidenhed eller et ønske om at overbevise. Således kan en nyhedsudsendelse tiltrække opmærksomhed ved at sige, at folk, der oftere forbruger et bestemt produkt, har et bestemt sundhedsproblem, hvilket antyder en årsagssammenhæng, som i virkeligheden kunne skyldes noget andet.

Relaterede sider

Cohen, J., Cohen P., West, S.G., & Aiken, L.S. (2003). Anvendt multipel regressions-/korrelationsanalyse for adfærdsvidenskab. (3rd ed.) Hillsdale, NJ: Lawrence Erlbaum Associates.

Spørgsmål og svar

Q: Hvad er korrelation?

A: Korrelation er en måde at angive, hvor tæt to datasæt er på hinanden.

Q: Betyder korrelation, at det ene sæt data forårsager det andet?

A: Nej, korrelation betyder ikke altid, at det ene sæt data er årsag til det andet. Faktisk er der ofte en tredje faktor involveret.

Q: Hvad er de to korrelationsretninger?

A: De to korrelationsretninger er positiv og negativ.

Q: Hvad betyder en positiv korrelation?

A: En positiv korrelation betyder, at de to datasæt går op sammen.

Q: Hvad betyder en negativ korrelation?

A: En negativ korrelation betyder, at det ene datasæt stiger, mens det andet falder.

Q: Findes der forskellige målinger af korrelation?

A: Ja, der bruges mange forskellige korrelationsmålinger til forskellige situationer.

Q: Hvordan viser folk ofte korrelationens retning på en spredningsgraf?

A: Man tegner ofte en linje for bedste tilpasning for at vise korrelationens retning på en spredningsgraf.