Ressourcen für empirische Methoden

Kruskal-Wallis-Test


entscheidbaum


1. Einführung
2. Vorgehensweise
3. Kruskal-Wallis-Test mit SPSS
4. SPSS-Befehle
5. Literatur

1. Einführung

Der Kruskal-Wallis-Test ist ein nicht-parametrisches statistisches Verfahren und dient der Überprüfung, ob sich die zentrale Tendenz von mehr als zwei unabhängigen Gruppen (oder Stichproben) unterscheidet. Die abhängige Variable soll mindestens ordinalskaliert sein. Eine Normalverteilung wird nicht vorausgesetzt. Der Kruskal-Wallis-Test kann dann eingesetzt werden, wenn bei intervallskalierten abhängigen Variablen die Voraussetzung der Normalverteilung zu stark verletzt wird.

Der Kruskal-Wallis-Test ist ein Rangsummentest bzw. Rangtest, bei dem die Berechnung der Teststatistik auf dem Vergleich von mehr als zwei Rangreihen basiert. Die Gruppen müssen nicht den gleichen Umfang aufweisen. Aus den Werten der Gruppen wird eine gemeinsame Reihe in aufsteigender Folge gebildet. Dahinter steht die Überlegung, dass sich die Daten unabhängiger Gruppen in einer gemeinsamen Rangreihe gleichmässig verteilen, wenn sie die gleiche zentrale Tendenz aufweisen. Der Kruskal-Wallis-Test stellt eine Erweiterung des Mann-Whitney-U-Test für zwei unabhängige Gruppen dar.

2. Vorgehensweise

Mit folgender Fragestellung wird im vorliegenden Kapitel die Vorhergehensweise beim Kruskal-Wallis-Test näher erläutert:

Gibt es Unterschiede hinsichtlich der zentralen Tendenz des Leistungsresultats einer schriftlichen Prüfung zwischen Schülerinnen und Schülern der verschiedenen Studienrichtungen (allgemein/berufsorientiert/akademisch)?

Der Ablauf des Kruskal-Wallis-Tests wird in der Literatur in vier Schritten zusammengefasst, die im Folgenden beschrieben werden.

2.1 Modellformulierung

Die Fragestellung wird anhand eines Datensatzes von den “Academic Technology Services” (“Statistical Consulting Group”) an der “University of California, Los Angeles” (UCLA) untersucht. Beim Eintritt in die „High-School“ absolvieren die Schülerinnen und Schüler unter anderem eine schriftliche Prüfung, deren Leistungsresultate im Datensatz enthalten sind. Zudem müssen sie sich für die Studienrichtung entscheiden: Sie wählen entweder das allgemeine („general“), das berufsorientierte („vocational“) oder das akademische Programm („academic“).

Zur Beantwortung der Fragestellung kann die Erstellung eines Modells hilfreich sein. Im vorliegenden Fall sieht das entsprechende Modell folgendermassen aus:

Abbildung 1: Beispielmodell

Abbildung 1: Beispielmodell

Im vorliegenden Beispiel ist die intervallskalierte, abhängige Variable „Leistungsresultats der schriftlichen Prüfung“ („writing score“) nicht normalverteilt. Deswegen ist die Durchführung des Kruskal-Wallis-Tests anstelle der Varianzanalyse angebracht.

2.2 Berechnung der Teststatistik

Die Berechnung der Teststatistik des Kruskal-Wallis-Tests beruht auf der gemeinsamen Rangreihe der Gruppen, die in Tabelle 1 dargestellt ist:

Tabelle 1: Auszug aus der gemeinsamen Rangreihe. Anmerkung: A = „„general“, B = „vocational, C = „academic“

Tabelle 1: Auszug aus der gemeinsamen Rangreihe. Anmerkung: A = „„general“, B = „vocational, C = „academic“

Die Mediane der Gruppen können in SPSS als Diagramm dargestellt werden. Dazu kann im Dialogfeld „Diagrammerstellung“ das gewünschte Diagramm (im vorliegenden Fall „Linie“) ausgewählt werden.

Abbildung 2: Darstellung der zentralen Tendenzen

Abbildung 2: Darstellung der zentralen Tendenzen

Der Kruskal-Wallis-Test überprüft, ob die in Abbildung 2 dargestellten Unterschiede der mittleren Ränge signifikant sind

Unterscheiden sich die zentralen Tendenzen der Gruppen nicht, würden sich deren Rangplätze gleichmässig verteilen. Bei drei Gruppen mit jeweils nur 4 Einheiten würde das Muster beispielsweise folgendermassen aussehen:

ABCABCABCABC oder AABBCCCCBBAA

Bei drei Gruppen mit jeweils nur 4 Einheiten und unterschiedlichen zentralen Tendenzen würde das Muster im Exremfall folgendermassen aussehen:

AAAABBBBCCCC

Bei dem erwähnten Muster würde beispielsweise Gruppe A die unteren Ränge, Gruppe B die mittleren und Gruppe C die höheren Ränge auf der gemeinsamen Rangreihe einnehmen. Die zentralen Tendenzen würden sich stark unterscheiden.

Die Teststatistik H des Kruskal-Wallis-Tests überprüft die Gleichmässigkeit der Verteilung der Rangplätze der unterschiedlichen Gruppen in der gemeinsamen Rangreihe und wird, falls keine Bindungen vorliegen, folgendermassen berechnet:

Abbildung 3: Berechnung der Teststatistik H (ohne Bindungen)

Abbildung 3: Berechnung der Teststatistik H (ohne Bindungen)

wobei
n= Gesamtstichprobengrösse
j=Gruppe j
k=Anzahl der Gruppen
nj=Stichprobengrösse der Gruppe j
Rj=Rangsumme der Gruppe j

Bei Vorhandensein von Werten mit der gleichen Ausprägung in den unterschiedlichen Stichproben, d.h. liegen Bindungen vor, wird die Teststatistik Hb folgendermassen berechnet:

Abbildung 4: Berechnung der Teststatistik Hb (mit Bindungen)

Abbildung 4: Berechnung der Teststatistik Hb (mit Bindungen)

wobei
m= Anzahl aller Bindungen
bx=Anzahl der Bindungen für einen einzelnen Wert xi

Die Rangsummen der Gruppen werden berechnet, indem alle Rangplätze der jeweiligen Rangreihe zusammengerechnet werden. Die Teststatistik H überprüft die Nullhypothese, dass die Verteilung der Rangplätze der unterschiedlichen Gruppen in der gemeinsamen Rangreihe gleichmässig ist.

2.3 Prüfung auf Signifikanz

In diesem Abschnitt wird die Teststatistik auf Signifikanz überprüft. Die berechnete Teststatistik H wird in SPSS mit dem kritischen Wert auf der durch die Stichrobengrössen bestimmten Testverteilung verglichen (siehe Kapitel 3: „Kruskal-Wallis-Test mit SPSS“).

Im vorliegenden Beispiel wird in SPSS einen p-Wert von .000 angezeigt. Da dieser Wert kleiner als das Signifikanzniveau von .050 ist, kann davon ausgegangen werden, dass es signifikante Unterschiede in den zentralen Tendenzen der Gruppen gibt.

2.4 Post Hoc Test

Der Kruskal-Wallis-Test gibt keine Auskunft darüber, welche zentralen Tendenzen sich signifikant von den anderen unterscheiden. Dazu können Post Hoc Tests (in diesem Fall „manuell“ durch Mann-Whitney-U-Tests) berechnet werden, die durch paarweise Vergleiche der Gruppen prüfen, welche Unterschiede in den zentralen Tendenzen dazu geführt haben, dass der Kruskal-Wallis-Test signifikant wird. In den neuen SPSS-Versionen können die Post Hoc Tests automatisch berechnet werden: Durch das Doppelklicken von „Übersicht über Hypothesentest“ eröffnet sich die „Modellanzeige“, wobei in der „Anzeige“ „Paarweise Vergleiche“ ausgewählt werden kann (siehe Kapitel 3: „Kruskal-Wallis-Test mit SPSS“).

3. Kruskal-Wallis-Test mit SPSS

3.1 Bei älteren SPSS-Versionen (bis SPSS 18) oder bei „alte Dialogfelder“ in den neueren Versionen

SPSS gibt bei der Berechnung des Kruskal-Wallis-Tests folgende Abbildung aus:

Abbildung 5: Mittlere Ränge. Anmerkung: N = Stichoprobengrösse

Abbildung 5: Mittlere Ränge. Anmerkung: N = Stichoprobengrösse

In Abbildung 5 sind die mittleren Ränge des Leistungsresultats der schriftlichen Prüfung der drei unabhängigen Gruppen der Beispieldaten dargestellt. Der mittlere Rang des Leistungsresultats der schriftlichen Prüfung ist bei Schülerinnen und Schülern, die „academic“ als Studienrichtung gewählt haben, am grössten. Bei Schülerinnen und Schülern, die „vocational“ als Studienrichtung gewählt haben, ist der mittlere Rang des Leistungsresultats der schriftlichen Prüfung am kleinsten.

Abbildung 6: Teststatistik H

Abbildung 6: Teststatistik H

In Abbildung 6 sind die Teststatistik H und der p-Wert angezeigt. Da dieser Wert kleiner als das Signifikanzniveau von .050 ist, kann davon ausgegangen werden, dass es signifikante Unterschiede in den zentralen Tendenzen des Leistungsresultats der schriftlichen Prüfung zwischen Schülerinnen und Schülern der verschiedenen Studienrichtungen (allgemein/berufsorientiert/akademisch) gibt.

3.2 Bei neueren SPSS-Versionen (ab SPSS 19)

Abbildung 7: Hypothesentestübersicht

Abbildung 7: Hypothesentestübersicht

In Abbildung 7 ist die Übersicht über den Hypothesentest angezeigt. Die Nullhypothese, die besagt, dass sich die zentralen Tendenzen der Gruppen nicht unterschieden, wird zugunsten der Alternativhypothese abgelehnt.

Abbildung 8: Post Hoc Tests

Abbildung 8: Post Hoc Tests

In Abbildung 8 sind die paarweisen Vergleiche zwischen den Gruppen angezeigt. Die Post-Hoc-Tests deuten darauf hin, dass sich die zentrale Tendenz des Leistungsresultats der schriftlichen Prüfung zwischen Schülerinnen und Schülern die „academic“ als Studienrichtungen gewählt haben signifikant von solchen unterscheidet, die „vocational“ und/oder „general“ gewählt haben. Es gibt aber keine signifikanten Unterschiede in der zentralen Tendenz des Leistungsresultats der schriftlichen Prüfung zwischen Schülerinnen und Schülern die „vocational“ und solchen, die „general“ gewählt haben.

Schülerinnen und Schüler, die „academic“ als Studienrichtungen gewählt haben, erreichten die besten Resultate in der schriftlichen Prüfung; die zweitbesten Resultate erreichten Schülerinnen und Schüler, die „general“ als Studienrichtungen gewählt habe; die schlechtesten Resultate erreichten Schülerinnen und Schüler, die „vocational“ als Studienrichtungen gewählt haben.


4. SPSS Befehle

SPSS-Datensatz: Verwendeter Beispieldatensatz zum Kruskal-Wallis-Test.sav

Klicksequenz:
Analysieren > Nichtparametrische Tests > zwei unabhängige Stichproben
Im Feld “Testvariablen“ > abhängige(n) Variable(n)
Im Feld “Gruppenvariable“ > unabhängige Gruppen („Stichproben“) definieren

Syntax:
NPTESTS
/INDEPENDENT TEST („AV“) GROUP („UV“)) KRUSKAL_WALLIS(COMPARE=PAIRWISE)
/MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE
/CRITERIA ALPHA=0.05 CILEVEL=95.

5. Literatur

Field, A. (2009). Discovering Statistics Using SPSS. London: Sage.
Gravetter, F. J. & Wallnau, L. B. (2009). Statistics for the behavioral sciences. Belmont: Wadsworth Cengage Learning.

top