Ressourcen für empirische Methoden

Rangkorrelation


entscheidbaum


1. Einführung
2. Vorgehensweise
3. Rangkorrelation mit SPSS
4. SPSS-Befehle
5. Literatur

1. Einführung

Die Rangkorrelation ist ein nicht-parametrisches, statistisches Verfahren und dient der Überprüfung des bivariaten Zusammenhangs zweier mindestens ordinalskalierter Merkmale, indem zwei Rangreihen miteinander verglichen werden. Zur Bestimmung der Stärke des Zusammenhanges kann der Rangkorrelationskoeffizient nach Spearman oder nach Kendall-Tau berechnet werden. Die Rangkorrelation kann unter anderem dann eingesetzt werden, wenn bei intervallskalierten abhängigen Variablen die Voraussetzung der Normalverteilung zu stark verletzt wird. Die Ausprägungen der beiden Variablen werden dazu in Rangplätze überführt.

2. Vorgehensweise

Mit folgender Fragestellung wird im vorliegenden Kapitel die Vorhergehensweise bei der Rangkorrelation näher erläutert:

Gibt es einen Zusammenhang zwischen den staatlichen Bildungsausgaben im Jahr 1990 und der Alphabetisierungsrate der Erwachsenen im Jahr 2003 in verschiedenen Ländern?

Der Ablauf der Rangkorrelation wird in der Literatur in drei Schritten zusammengefasst, die im Folgenden beschrieben werden.

2.1 Modellformulierung

Die Fragestellung wird anhand eines Datensatzes aus Caramani (2008) untersucht. Es handelt sich um die Daten von 114 Ländern. Zur Beantwortung der Fragestellung kann die Erstellung eines Modells hilfreich sein. Im vorliegenden Fall sieht das entsprechende Modell folgendermassen aus:

Abbildung 1: Beispielmodell. Anmerkung: GDP = „Gross domestic product“

Abbildung 1: Beispielmodell. Anmerkung: GDP = „Gross domestic product“

Die zwei Variablen „Public expenditure on education“ und „Adult literacy rate“ sind intervallskaliert. Eine der beiden Variablen („Adult literacy rate“) ist nicht normalverteilt. Deswegen ist die Durchführung der Rangkorrelation nach Spearman oder nach Kendall-Tau anstelle der Korrelation nach Pearson angebracht.

2.2 Berechnung der Korrelationskoeffizienten

In diesem Abschnitt werden die Korrelationskoeffizienten berechnet. In Tabelle 1 sind die Beispieldaten als Rohdaten und in rangierter Form dargestellt:

Tabelle 1: Beispieldaten. Anmerkung: 1 = Variable „Public expenditure on education as % of GDP in 1990“; 2 = Variable „Adult literacy rate in 2003 (% ages 15 and above)“

Tabelle 1: Beispieldaten. Anmerkung: 1 = Variable „Public expenditure on education as % of GDP in 1990“; 2 = Variable „Adult literacy rate in 2003 (% ages 15 and above)“

Um die Rangkorrelation zu berechnen wurden die Rohwerte (in diesem Fall Prozentzahlen) der beiden Variablen in Rangplätze übertragen. Mit dieser Vorhergehensweise können intervallskalierte und ordinalskalierte Variable miteinander vergleichen werden. Die Rangreihen der beiden Variablen umfassen im vorliegenden Beispiel insgesamt 114 Ränge (Anzahl der untersuchten Länder). Albanien gab im Jahr 1990 beispielsweise 5.9% des Bruttoinlandproduktes für Bildung aus. Dies entspricht dem 94sten Rang (siehe blaue Markierungen in Tabelle 1). Bei Bindungen (mehrere Untersuchungseinheiten weisen denselben Wert auf) werden die Mittelwerte der jeweiligen Rangplätze gebildet und den Untersuchungseinheiten zugeordnet. Beispielsweise wiesen Spanien und Uruguay im Jahr 2003 eine Alphabetisierungsrate der Bevölkerung, die älter als 15 Jahren alt war, von 97.7% auf. Dies entspricht den Rängen 90 und 91. Dabei wurde beiden Ländern der Wert von 90.50 (Mittelwerte der Rangplätze) vergeben (siehe rote Markierungen in Tabelle 1).

Der Rangkorrelationskoeffizient ρ (Rho) nach Spearman wird anhand der folgenden Formel berechnet:

Abbildung 2: Berechnung des Rangkorrelationskoeffizienten ρ (Rho) nach Spearman

Abbildung 2: Berechnung des Rangkorrelationskoeffizienten ρ (Rho) nach Spearman

wobei
ri = Rangplatz der i-ten Untersuchungseinheit innerhalb der ersten Variable
si = Rangplatz der j-ten Untersuchungseinheit innerhalb der zweiten Variable
n = Anzahl der Untersuchungseinheiten

Die erwähnte Formel kann nur dann eingesetzt werden, wenn keine verbundene Rangplätze (Bindungen) vorkommen. Im vorliegenden Beispiel kann diese Formel nicht angewendet werden. Für die Berechnung der Teststatistik beim Vorhandensein von Bindungen wird in der Literatur eine äusserst komplizierte Formel vorgeschlagen, auf die an dieser Stelle nicht eingegangen wird.

Eine Alternative zum Spearman-Rho-Korrelationskoeffizienten stellt der Kendall-Tau-b-Koeffizient dar, der beim Vorhandensein von Ausreissern weniger empfindlich gegenüber Verzerrungen ist. Beim Vorliegen von Bindungen sowie bei kleinen Stichproben ist der Kendall-Tau-b-Koeffizient dem Spearman-Rho-Korrelationskoeffizienten vorzuziehen. Normalerweise ist der Kendall-Tau-b-Koeffizient etwas kleiner als der Spearman-Rho-Korrelationskoeffizient.

Wie der Produkt-Moment-Korrelationskoeffizient nach Pearson nehmen auch der Spearman-Rho-Korrelationskoeffizient und der Kendall-Tau-b-Koeffizient immer Werte zwischen -1 und 1 an, wobei negative Werte einen negativen Zusammenhang und positive Werte einen positiven Zusammenhang andeuten.

SPSS gibt für die Beispieldaten einen Spearman-Rho-Korrelationskoeffizienten von .305 und einen Kendall-Tau-b-Koeffizienten von .207 aus (siehe Kapitel 3: „Rangkorrelation mit SPSS“).

2.3 Prüfung auf Signifikanz

In diesem Abschnitt werden die Korrelationskoeffizienten auf Signifikanz überprüft. Die Nullhypothesen der Rangkorrelation besagt, dass der Korrelationskoeffizient gleich Null ist. Anhand der Grösse der Korrelationskoeffizienten können keine Aussage darüber gemacht werden, ob ein signifikanter Zusammenhang besteht oder nicht. Die Stichprobengrösse hat unter anderem einen Einfluss darauf, ob ein bestimmter Korrelationskoeffizient signifikant ist. Bei grossen Stichproben kann beispielsweise schon ein kleiner Korrelationskoeffizient signifikant sein. Die Signifikanz des Rangkorrelationskoeffizienten wird mit einem t-Test überprüft.

Bei der Berechnung der Korrelation gibt SPSS automatisch den p-Wert aus. Im SPSS-Dialogfenster „Bivariate Korrelationen“ wird zwischen einseitigem oder zweiseitigem Signifikanztest unterschieden. Liegen keine Annahmen über die Richtung des Zusammenhangs der beiden Variablen vor (bei ungerichtete Hypothesen), ist es empfehlenswert, zweiseitig auf Signifikanz zu testen.

Im vorliegenden Beispiel wird in SPSS sowohl für den Spearman-Rho-Korrelationskoeffizienten wie auch für den für den Kendall-Tau-b-Koeffizienten ein p-Wert von .013 angezeigt (siehe Kapitel 3: „Rangkorrelation mit SPSS“). Da dieser Wert kleiner als das Signifikanzniveau von .050 ist, kann davon ausgegangen werden, dass sich beide Korrelationskoeffizienten signifikant von Null unterscheiden.

3. Rangkorrelation mit SPSS

SPSS gibt bei der Berechnung der Rangkorrelation folgende Abbildungen aus:

Abbildung 3: Spearman-Rho-Korrelationskoeffizient mit dazugehörigem p-Wert

Abbildung 3: Spearman-Rho-Korrelationskoeffizient mit dazugehörigem p-Wert

In Abbildung 3 ist der Spearman-Rho-Korrelationskoeffizient mit dazugehörigem p-Wert angezeigt.

Abbildung 4: Kendall-Tau-b-Korrelationskoeffizient mit dazugehörigem p-Wert

Abbildung 4: Kendall-Tau-b-Korrelationskoeffizient mit dazugehörigem p-Wert

In Abbildung 4 ist der Kendall-Tau-b-Koeffizient mit dazugehörigem p-Wert angezeigt. Da dieser Wert kleiner als das Signifikanzniveau von .050 ist, kann die Nullhypothese verworfen und die Alternativhypothese angenommen werden. Die zwei untersuchten Variablen weisen eine signifikante, positive Korrelation auf. Je grösser die staatlichen Bildungsausgaben im Jahr 1990 in den verschiedenen Ländern sind, desto grösser ist die Alphabetisierungsrate der Erwachsenen im Jahr 2003.

4. SPSS-Befehle

SPSS-Datensatz: Verwendeter Beispieldatensatz zum Rangkorrelation.sav

Klicksequenz: Analysieren > Korrelation > Bivariat
Im Dialogfenster „Sperman“ und/oder „Kendall-Tau-b“ auswählen.

Syntax: NONPAR CORR

5. Literatur

Caramani, D. (2008). Comparative Politics. Oxford: Oxford University Press
Field, A. (2009). Discovering Statistics Using SPSS. London: Sage.
Gravetter, F. J. & Wallnau, L. B. (2009). Statistics for the behavioral sciences. Belmont: Wadsworth Cengage Learning.

top