Ressourcen für empirische Methoden

Korrelation


entscheidbaum


1. Einführung
2. Vorgehensweise
3. Korrelation mit SPSS
4. SPSS-Befehle
5. Literatur

1. Einführung

Eine Korrelationsanalyse gibt Auskunft über den statistischen Zusammenhang zweier intervallskalierter (LINK zu Skalenniveaus) Merkmale. Da es sich um zwei Variablen handelt, wird von einem bivariaten Zusammenhang gesprochen. Eine Korrelationsanalyse sollte immer dann einer einfachen linearen Regressionsanalyse vorgezogen werden, wenn keine Aussage über die vermutete Richtung des Zusammenhangs gemacht werden kann.

1.1. Mögliche Problemstellungen

Die Korrelationsanalyse eignet sich für Fragen, welche einen Zusammenhang zwischen zwei Merkmalen untersuchen wie „Gibt es einen Zusammenhang zwischen Alter und politischer Orientierung?“ oder „Hängen Arbeitszeit und Einkommen zusammen?“

2. Vorgehensweise

Das Vorgehen bei der Berechnung einer bivariaten Korrelation wird an einer möglichen Fragestellung aus dem Bereich Human Ressources erläutert.

Im Rahmen eines Forschungsprojektes werden Daten über den Motivationsgrad einer Person durch einen standardisierten Test erhoben. Der ermittelte Motivationsindex kann Werte zwischen 0 und 20 annehmen. Ebenfalls wurde aus verschiedenen Messwerten (z.B. Gehalt, Beförderungsgeschwindigkeit etc.) ein Index für den beruflichen Erfolg einer Person erfasst, wobei dieser Werte zwischen 0 und 100 annehmen kann. Beide Variablen können damit als intervallskaliert interpretiert werden. Folgender Forschungsfrage soll nachgegangen werden:

Gibt es einen Zusammenhang zwischen Motivation und Erfolg?

Ziel ist es zu untersuchen, ob die Motivation einer Person und ihren/seinen Erfolg im Berufsleben in einem Zusammenhang stehen.

2.1 Hypothesenformulierung

Um die Forschungsfrage statistisch zu überprüfen, werden Hypothesen aufgestellt. Bei der Formulierung der Hypothese stellt sich die Frage, in welchem Zusammenhang „Erfolg“ und „Motivation“ stehen. Einerseits kann angenommen werden, dass je stärker eine Person motiviert ist, desto erfolgreicher diese/dieser im Beruf auch ist. Andererseits kann aber auch der berufliche Erfolg dazu führen, dass die Person noch motivierter an ihre/seine Aufgaben herangeht.

Die Nullhypothese und die Alternativhypothese lauten wie folgt:

H0: r = 0 Der Korrelationskoeffizient ist gleich null.
HA: r ≠ 0 Der Korrelationskoeffizient ist ungleich null.

Zur Überprüfung der Hypothese werden Daten herangezogen. In der folgenden Tabelle 1: Bespieldaten sind die Daten von 12 Probanden aufgeführt.

Tabelle 1: Beispieldaten

Tabelle 1: Beispieldaten

Das Streudiagramm lässt vermuten, dass ein linearer Zusammenhang zwischen den Variablen „Erfolg“ und „Motivation“ besteht.

 

Abbildung 1: Streudiagramm

Abbildung 1: Streudiagramm

2.2 Berechnung des Korrelationskoeffizienten

Der Berechnung des Korrelationskoeffizienten r geht die Annahme voraus, dass ein linearer und ungerichteter Zusammenhang zwischen den beiden Variablen besteht.

Hinweis: Die Korrelationskoeffizient r wird auch als „Produkt-Moment-Korrelation“, „Pearson-Korrelation“, „Produkt-Moment-Korrelation nach Pearson und Bravais“ oder als „Bravais-Pearson-Korrelation“ bezeichnet

Der Korrelationskoeffizient r lässt sich berechnen, indem die Kovarianz (cov(x,y)) zweier Variablen (x,y) durch das Produkt der Standardabweichungen der Variablen (sx, sy) dividiert wird. Infolge der Division der Kovarianz durch das Produkt der Standardabweichung ist der Korrelationskoeffizient gegenüber einer Massstabsveränderung bzw. einer linearen Transformation invariant und kann Werte zwischen -1 und 1 annehmen.

2.3 Durchführung des Hypothesentests

Der Korrelationskoeffizient erlaubt eine Aussage über die Enge des Zusammenhanges. Um jedoch zu prüfen, ob sich auch Rückschlüsse über einen Zusammenhang in der Grundgesamtheit ziehen lassen, ist ein Hypothesentest erforderlich. Im Falle des Korrelationskoeffizienten überprüft der t-Test die Hypothese, dass sich der Korrelationskoeffizient signifikant von 0 unterscheidet.

Voraussetzung Datenlage: Die Durchführung des t-Tests setzt normal verteilte Variablen voraus. Ausnahme: Eine der beiden Variablen ist eine Dummy-Variable (2 Kategorien).

Ob ein Korrelationskoeffizient signifikant wird oder nicht hängt unter anderem von der Stichprobengrösse n ab. So reicht bei einer grossen Stichprobe ein kleinerer Wert von r aus, um signifikant zu werden, als dies bei einer kleinen Stichprobe der Fall ist. Ist ein Korrelationskoeffizient signifikant ist, stellt sich die Frage, ob das Ergebnis auch praktisch relevant sein. Hierfür eignet sich das Mass der Effektstärke, welches einerseits erlaubt, Aussagen über die praktische Relevanz eines signifikanten Testergebnisses zu machen und anderseits von der Stichprobengrösse n kaum beeinflusst wird.

Der Korrelationskoeffizient r als standardisiertes Mass wird allgemein zur Messung der Effektstärke verwendet. Nach Cohen (1992) und Field (2009: 170) gelten bei einer Korrelationsanalyse folgende Werte, um eine Aussage über die Stärke des Effekts zu machen, wobei das Vorzeichen (+/-) die Richtung des Zusammenhanges angibt (vgl. Tabelle 2: Effektstärken).

Tabelle 2: Effektstärken

Tabelle 2: Effektstärken

Durch das Quadrieren der Korrelation lässt sich das Bestimmtheitsmass r2 berechnen. Dieses beschreibt den erklärten Anteil der Varianz der Daten (vgl. Tabelle 3: Bestimmtheitsmass).

Tabelle 3: Bestimmtheitsmass

Tabelle 3: Bestimmtheitsmass


3. Korrelation mit SPSS

SPSS gibt bei der Berechnung der Korrelation automatisch den p-Wert (in SPSS als Signifikanzwert bezeichnet) an.

Hinweis: Es lässt sich im Dialogfenster zusätzlich die Option auswählen, ob signifikante Korrelationen markiert werden sollen. Hierbei ist jedoch zu beachten, dass SPSS eventuell ein anderes Signifikanzniveau voraussetzt. Daher sollten die Werte nochmals überprüft und mit dem festgesetzten Signifikanzniveau verglichen werden.

Aus der in SPSS generierten Tabelle lassen sich die Korrelation und der p-Wert ablesen (vgl. Abbildung 2: SPSS Output der Beispieldaten):

Abbildung 2: SPSS Output der Beispieldaten

Abbildung 2: SPSS Output der Beispieldaten

„Erfolg“ und „Motivation“ korrelieren mit einem p-Wert von .005. Wird ein Signifikanzniveau von α = .050 vorausgesetzt, kann die Nullhypothese verworfen werden. Das heisst, die Alternativhypothese, dass der Korrelationskoeffizient ungleich 0 ist, kann angenommen werden. SPSS gibt für die Beispieldaten einen Korrelationskoeffizienten von .751 aus. Es kann folglich von einem positiven linearen Zusammenhang zwischen „Motivation“ und „Erfolg“ ausgegangen werden. Ein r von .751 weist zudem auf einen grossen Effekt hin (vgl. Tabelle 2: Effektstärken). Durch das Quadrieren des Korrelationswertes r ergibt sich ein r²-Wert von .564. 56.4% der Variabilität der Daten kann durch das Modell erklärt werden.

Hinweis zu Abbildung 2: Die Korrelationskoeffizienten von 1 in der Diagonale erklären sich durch die Korrelation der Variable mit sich selbst.

4. SPSS-Befehle

Klicksequenz: Analysieren > Korrelation > Bivariat
(Im Dialogfenster „Pearson“ auswählen)

Syntax: CORRELATION

5. Literatur

Field, Andy (2009). Discovering Statistics Using SPSS. 166-196.
Cohen, J. (1992). A power primer. Psychological Bulletin, 112: 155-159.

top