Korrelationsanalyse

Korrelationsanalyse ist ein statistisches Verfahren, mit dem untersucht wird, ob zwischen zwei Variablen ein Zusammenhang besteht und wie stark sowie in welche Richtung dieser Zusammenhang ausfällt. Das Ergebnis wird häufig als Korrelationskoeffizient ausgedrückt, der typischerweise Werte zwischen -1 und +1 annehmen kann: Positive Werte deuten darauf hin, dass beide Variablen tendenziell gemeinsam steigen oder fallen, negative Werte sprechen für gegenläufige Veränderungen, und Werte nahe 0 weisen auf keinen oder nur einen sehr schwachen (linearen) Zusammenhang hin. Welche Kennzahl verwendet wird, hängt vom Datentyp und der erwarteten Beziehung ab. Die Pearson-Korrelation wird vor allem genutzt, um lineare Zusammenhänge zwischen metrischen Variablen zu beschreiben. Rangkorrelationen wie Spearman (und häufig auch Kendall) sind geeignet, wenn es um monotone Beziehungen geht oder wenn Daten eher ordinal sind beziehungsweise Ausreißer eine größere Rolle spielen. Wichtig für die Interpretation ist: Korrelation beschreibt statistische Gemeinsamkeit, nicht automatisch Ursache und Wirkung. Ein beobachteter Zusammenhang kann zum Beispiel durch eine dritte Variable mitverursacht sein.