Ressourcen für empirische Methoden

Mann-Whitney-U-Test


entscheidbaum


1. Einführung
2. Vorgehensweise
3. Man-Whitney U mit SPSS
4. SPSS-Befehle
5. Literatur

1. Einführung

Der Mann-Whitney-U-Test ist ein nicht-parametrisches statistisches Verfahren und dient der Überprüfung, ob sich die zentrale Tendenz in zwei unabhängigen Gruppen (oder Stichproben) unterscheidet. Die abhängige Variable soll mindestens ordinalskaliert sein. Eine Normalverteilung wird nicht vorausgesetzt. Der Mann-Whitney-U-Test kann dann eingesetzt werden, wenn bei intervallskalierten abhängigen Variablen die Voraussetzung der Normalverteilung zu stark verletzt wird.

Der Mann-Whitney-U-Test ist ein Rangsummentest bzw. Rangtest, bei dem die Berechnung der Teststatistik auf dem Vergleich von zwei Rangreihen basiert. Die beiden Gruppen müssen nicht den gleichen Umfang aufweisen. Aus den Werten der beiden Gruppen wird eine gemeinsame Reihe in aufsteigender Folge gebildet. Dahinter steht die Überlegung, dass sich die Daten zweier unabhängiger Gruppen in einer gemeinsamen Rangreihe gleichmässig verteilen, wenn sie die gleiche zentrale Tendenz aufweisen.

2. Vorgehensweise

Mit folgender Fragestellung wird im vorliegenden Kapitel die Vorhergehensweise beim Mann-Whitney-U-Test näher erläutert:

Gibt es Unterschiede hinsichtlich der zentralen Tendenz der Darlehenshöhe zwischen Kreditnehmern, die den Kredit zurückgezahlt haben, und solchen, die dies versäumten?

Der Ablauf des Mann-Whitney-U-Tests wird in der Literatur in drei Schritten zusammengefasst, die im Folgenden beschrieben werden.

2.1 Modellformulierung

Die Fragestellung wird anhand eines Datensatzes des Archivs des „Instituts für Statistik der Ludwig-Maximilians-Universität München“ und des „Sonderforschungsbereichs 386“ untersucht. Es handelt sich um die Daten zur Klassifikation von Kreditnehmern, die vor einigen Jahren von einer deutschen Grossbank durchgeführt wurde. Zur Beantwortung der Fragestellung kann die Erstellung eines Modells hilfreich sein. Im vorliegenden Fall sieht das entsprechende Modell folgendermassen aus:

Abbildung 1: Beispielmodell

Abbildung 1: Beispielmodell

Im vorliegenden Beispiel wurden zwei Variablen berücksichtigt: Die Dummy-Variable „Kredit“ (mit den Ausprägungen „Kredit wurde zurückgezahlt“ und „Kredit wurde nicht zurückgezahlt“) sowie „Darlehenshöhe in Deutsche Mark“. Diese Variable ist ordinal- und nicht intervallskaliert, da sie auf zehn Ausprägungen diskretisiert wurde.

2.2 Berechnung der Teststatistik

In diesem Abschnitt wird die Teststatistik berechnet. In Tabelle 1 sind unter anderem die mittleren Ränge un die Dangsummen der zwei unabhängigen Gruppen der Beispieldaten dargestellt:

Tabelle 1: Beispieldaten. Anmerkung: N = Gruppengrösse

Tabelle 1: Beispieldaten. Anmerkung: N = Gruppengrösse

Der Mann-Whitney-U-Test überprüft, ob der Unterschied der mittleren Ränge signifikant ist. Die Berechnung der Teststatistik beruht auf der gemeinsamen Rangreihe beider Gruppen, die in Tabelle 2 dargestellt ist:

Tabelle 2:Gemeinsame Rangreihe. Anmerkung: A = „Kredit wurde nicht zurückgezahlt“, B = „Kredit wurde zurückgezahlt“

Tabelle 2:Gemeinsame Rangreihe. Anmerkung: A = „Kredit wurde nicht zurückgezahlt“, B = „Kredit wurde zurückgezahlt“

Unterscheidet sich die zentrale Tendenz beider Gruppen nicht, würden sich deren Rangplätze gleichmässig verteilen. Bei Gruppen mit nur 4 Einheiten würde das Muster beispielsweise folgendermassen aussehen:

ABABABABAB oder AABBBBAA

Bei zwei Gruppen mit nur 4 Einheiten und unterschiedlichen zentralen Tendenzen würde das Muster im Exremfall folgendermassen aussehen:

AAAABBBB

Bei dem erwähnten Muster würde beispielsweise Gruppe 1 die unteren Ränge und Gruppe 2 die höheren Ränge auf der gemeinsamen Rangreihe einnehmen. Die zentralen Tendenzen würden sich stark unterscheiden.

Die Teststatistik U des Mann-Whitney-U-Tests überprüft die Nullhypothese, dass die Verteilung der Rangplätze in der gemeinsamen Rangreihe gleichmässig ist. Die Teststatistik wird für die erste Gruppe (im Beispiel die Gruppe „Kredit wurde zurückgezahlt“) folgendermassen berechnet:

Abbildung 2: Berechnung der Teststatistik für Gruppe 1

Abbildung 2: Berechnung der Teststatistik für Gruppe 1

wobei
n1= Grösse der Gruppe 1
n2= Grösse der Gruppe 2
T1= Rangsumme der Gruppe 1
Analog wird die Teststatistik für die zweite Gruppe („Kredit wurde nicht zurückgezahlt“) berechnet:

Abbildung 3: Berechnung der Teststatistik für Gruppe 2

Abbildung 3: Berechnung der Teststatistik für Gruppe 2

wobei
n1= Grösse der Gruppe 1
n2= Grösse der Gruppe 2
T2= Rangsumme der Gruppe 2

Die Rangsummen der Gruppen werden berechnet, indem alle Rangplätze der jeweiligen Rangreihe aufsummiert werden. Im vorliegenden Beispiel beträgt die Rangsumme von Gruppe 1 („Kredit wurde zurückgezahlt“) 340’226 und folgenderweise das U1 360’474. Die Rangsumme von Stichprobe 2 („Kredit wurde nicht zurückgezahlt“) beträgt 160’274 und das U2 94’876. Als Prüfgrösse dient der kleinere der beiden Werte, im vorliegenden Beispiel also 94’876.

U widerspiegelt die Summe der Rangplatzüberschreitungen. Manuell kann U berechnet werden, indem für jeden Rang der einen Gruppe abgezählt wird, wie häufig eine Überschreitung von einem Rang aus der anderen Gruppe vorkommt. Das Abzählen ist bei grossen Gruppen sehr aufwändig, deshalb wird U über die Rangsummen ermittelt.

2.3 Prüfung auf Signifikanz

In diesem Abschnitt wird die berechnete Teststatistik auf Signifikanz überprüft. Der kleinere U-Wert wird mit dem kritischen Wert auf der theoretischen U-Verteilung verglichen. Falls die beiden Gruppen jeweils mehr als 10 Einheiten umfassen, entspricht die U-Verteilung nahezu einer Normalverteilung und die Teststatistik wird mit dem kritischen Wert auf der z-Verteilung verglichen.

Bei kleinen Gruppen (n1 < 10 und/oder n2 < 10) ist in SPSS die Zeile mit der „Exakten Signifikanz“ relevant. Bei grösseren Gruppen wird der p-Wert der Zeile „Asymptotische Signifikanz“ verwendet (siehe Kapitel 3: „Mann-Whitney-U-Test mit SPSS“). Im vorliegenden Beispiel wird in SPSS einen p-Wert von .013 angezeigt. Da dieser Wert kleiner als das Signifikanzniveau von .050 ist, kann davon ausgegangen werden, dass sich die zentrale Tendenz der zwei Gruppen unterscheiden.

3. Mann-Whitney-U-Test mit SPSS

SPSS gibt bei der Berechnung des Mann-Whitney-U-Tests folgende Abbildung aus:

Abbildung 4: Rangsummen

Abbildung 4: Rangsummen

In Abbildung 4 sind die mittleren Ränge und die Rangsummen der beiden Gruppen angezeigt. Der mittlere Rang der diskretisierten Darlehenshöhe ist bei Kreditnehmern, die es versäumten, den Kredit zurückzuzahlen, höher als bei solchen, die den Kredit zurückgezahlt haben.

Abbildung 5: Teststatistik

Abbildung 5: Teststatistik

In Abbildung 5 werden die Teststatistik U und der p-Wert angezeigt. Dieser Wert ist kleiner als das Signifikanzniveau von .050. Es kann davon ausgegangen werden, dass sich die zentrale Tendenz der Darlehenshöhe zwischen Kreditnehmern, die den Kredit zurückgezahlt haben, und solchen, die dies versäumten, signifikant unterschiedet.


4. SPSS-Befehle

SPSS-Datensatz: Verwendeter Beispieldatensatz zum Mann-Whitney-U-Test.sav

Klicksequenz: Analysieren > Nichtparametrische Tests > zwei unabhängige Stichproben
Im Feld “Testvariablen“ > abhängige(n) Variable(n)
Im Feld “Gruppenvariable“ > zwei unabhängige Gruppen („Stichproben“) definieren

Syntax: NPAR TESTS M-W

5. Literatur

Gravetter, F. J. & Wallnau, L. B. (2009). Statistics for the behavioral sciences. Belmont: Wadsworth Cengage Learning.

top