Ressourcen für empirische Methoden

Friedmann-Test


entscheidbaum


1. Einführung
2. Vorgehensweise
3. Friedmann-Test mit SPSS
4. SPSS-Befehle
5. Literatur

1. Einführung

Der Friedman-Test ist ein nicht-parametrisches statistisches Verfahren und dient der Überprüfung, ob sich die zentrale Tendenz in mehr als zwei verbundenen Gruppen (oder Stichproben) unterscheidet. Dazu werden wiederholt Messungen an denselben Untersuchungseinheiten durchgeführt, wobei es sich um Messungen zu verschiedenen Zeiten oder um mehrfache Behandlungen (z.B. Medikamente A, B, C) handeln kann. Die verbundenen Daten werden innerhalb jeder Untersuchungseinheit (z.B. Versuchsperson) rangiert. Die Gruppen müssen den gleichen Umfang aufweisen. Die abhängige Variable soll mindestens ordinalskaliert sein. Der Friedman-Test kann dann eingesetzt werden, wenn bei intervallskalierten abhängigen Variablen die Voraussetzung der Normalverteilung zu stark verletzt wird und es nicht zulässig ist, eine einfaktorielle Varianzanalyse mit Messwiederholung durchzuführen.

Der Friedman-Test (auch als Rangvarianzanalyse bezeichnet) ist ein Rangtest, indem die Berechnung der Teststatistik auf den Vergleich von mehreren Rangreihen basiert. Dahinter steht die Überlegung, dass sich die Daten der verbundenen Gruppen in einer gemeinsamen Rangreihe gleichmässig verteilen, wenn sie die gleiche zentrale Tendenz aufweisen. Der Friedman-Test stellt eine Erweiterung des Wilcoxon-Vorzeichen-Rang-Tests für zwei verbundene Gruppen dar.

2. Vorgehensweise

Mit folgender Fragestellung wird im vorliegenden Kapitel die Vorhergehensweise beim Friedman-Test näher erläutert:

Gibt es Unterschiede im Schweregrad der Akne von Patienten zu verschiedenen Messzeitpunkten (vor Behandlungsbeginn, 4 Wochen, 8 Wochen und 12 Wochen nach Beginn einer medikamentösen Behandlung)?

Der Ablauf des Friedman-Tests wird in der Literatur in vier Schritten zusammengefasst, die im Folgenden beschrieben werden.

2.1 Modellformulierung

Die Fragestellung wird anhand eines Datensatzes von der „University of York” untersucht. Es handelt sich um die Daten von 14 Patienten mit Akne, denen zur Behandlung über einen Zeitraum von 12 Wochen ein Medikament verabreicht wurde. Dabei wurde die Veränderung des Schweregrads der Akne auf einer 12-stufigen Skala gemessen. Zur Beantwortung der Fragestellung kann die Erstellung eines Modells hilfreich sein. Im vorliegenden Fall sieht das entsprechende Modell folgendermassen aus:

Abbildung 1: Beispielmodell

Abbildung 1: Beispielmodell

Im vorliegenden Beispiel werden die 12-stufige abhängige Variablen „Acne Severity Scores“ vor Behandlungsbeginn, 4 Wochen, 8 Wochen und 12 Wochen nach Beginn der medikamentösen Behandlung berücksichtigt.

2.2 Berechnung der Teststatistik

In diesem Abschnitt wird die Teststatistik berechnet. In Tabelle 1 sind die Beispieldaten sowie die Berechnungen der Rangsummen der unterschiedlichen Messzeitpunkte dargestellt:

Tabelle 1: Beispieldaten mit Berechnungen der Rangsummen

Tabelle 1: Beispieldaten mit Berechnungen der Rangsummen

Die Werte des „Acne Severity Score“ werden innerhalb jeder Versuchsperson rangiert. Bei Bindungen (selber Wert bei mehreren Messzeitpunkten) werden die Durchschnittsränge berechnet. Die dritte Versuchsperson weist beispielsweise sowohl 4 Wochen als auch 8 Wochen nach Beginn der medikamentösen Behandlung einen „Acne Severity Score“ von 4 auf, was dem ersten und dem zweiten Rang innerhalb der Person entspricht. Dabei wird zweimal der Rangwert von 1.5 (Mittelwert der beiden Rangplätze) zugewiesen. Die Rangsummen der Messzeitpunkte werden durch das Aufsummieren aller Rangplätze gebildet.

Die Teststatistik FR des Friedman-Tests wird folgendermassen berechnet:

Abbildung 2: Berechnung der Teststatistik H

Abbildung 2: Berechnung der Teststatistik H

wobei
n= Stichprobengrösse (für jeden Messzeitpunkt gleich gross)
j=Messzeitpunkt j
k=Anzahl der Messzeitpunkte
Rj=Rangsumme des j-ten Messzeitpunktes

SPSS berechnet die Rangsummen aller Messzeitpunkte sowie die Teststatistik FR des Friedman-Tests automatisch.

2.3 Prüfung auf Signifikanz

In diesem Abschnitt wird die Teststatistik auf Signifikanz überprüft. Falls der Stichprobenumfang bei drei Messzeitpunkten grösser als 10 ist und/oder bei mehr als drei Messzeitpunkten grösser als 5 (wie im vorliegenden Beispiel), ist die Teststatistik FR Chi²-verteilt. In diesem Fall wird der berechnete FR-Wert mit dem kritischen Wert auf der durch die Freiheitsgrade bestimmte Chi²-Verteilung verglichen. In SPSS wird der Vergleich automatisch durchgeführt.
Die Arbeitshypothese des Friedman-Tests besagt, dass die Verteilung der Rangplätze der unterschiedlichen Messzeitpunkte in der gemeinsamen Rangreihe gleichmässig ist. Im vorliegenden Beispiel wird in SPSS einen p-Wert von .000 angezeigt (siehe Kapitel 3: „Friedman-Test mit SPSS“). Da dieser Wert kleiner ist als das Signifikanzniveau von .050, kann davon ausgegangen werden, dass sich die Rangplätze der unterschiedlichen Messzeitpunkte in der gemeinsamen Rangreihe nicht gleich verteilen.

2.4 Post Hoc Tests

Der Friedman-Test gibt keine Auskunft darüber, welche/r Median/e sich signifikant von den anderen unterscheidet/n. Dazu können Post Hoc Tests (in diesem Fall „manuell“ durch Wilcoxon-Vorzeichen-Rang-Tests) berechnet werden, die durch paarweise Vergleiche der Gruppen prüfen, welche Unterschiede in den zentralen Tendenzen dazu geführt haben, dass der Friedman-Test signifikant wird. In den neuen SPSS-Versionen können die Post Hoc Tests automatisch berechnet werden: Durch das Doppelklicken von „Übersicht über Hypothesentest“ eröffnet sich die „Modellanzeige“, wobei in der „Anzeige“ „Paarweise Vergleiche“ ausgewählt werden kann (siehe Kapitel 3: „ Friedman-Test mit SPSS“).

3. Friedman-Test mit SPSS

3.1 Bei älteren SPSS-Versionen (bis SPSS 18) oder bei „alte Dialogfelder“ in den neueren Versionen

SPSS gibt bei der Berechnung des Friedman-Tests folgende Abbildungen aus:

Abbildung 3: Mittlere Ränge.

Abbildung 3: Mittlere Ränge.

In Abbildung 3 sind die mittleren Ränge der „Acne Severity Scores“ der einzelnen Messzeitpunkte der Beispieldaten dargestellt. Der mittlere Rang der „Acne Severity Scores“ ist vor dem Behandlungsbeginn am grössten und 12 Wochen nach Beginn der medikamentösen Behandlung am kleinsten.

Abbildung 4: Teststatistik

Abbildung 4: Teststatistik

In Abbildung 4 sind die Teststatistik und der p-Wert angezeigt. Dieser Wert ist kleiner als das Signifikanzniveau von .050. Es kann davon ausgegangen werden, dass mindestens einer der mittleren Ränge signifikant von den anderen abweicht.

3.2 Bei neueren SPSS-Versionen (ab SPSS 19)

Abbildung 5: Hypothesentestübersicht

Abbildung 5: Hypothesentestübersicht

In Abbildung 5 ist die Übersicht über den Hypothesentest angezeigt. Die Nullhypothese, die besagt, dass die Verteilung der Rangplätze der unterschiedlichen Messzeitpunkte in der gemeinsamen Rangreihe gleichmässig ist, wird zugunsten der Alternativhypothese abgelehnt.

Abbildung 6: Post Hoc Tests

Abbildung 6: Post Hoc Tests

In Abbildung 6 sind die paarweisen Vergleiche zwischen den Messzeitpunkten angezeigt. Die Post-Hoc-Tests deuten darauf hin, dass sich der mittlere Rang der „Acne Severity Scores“ vor dem Behandlungsbeginn signifikant von den mittleren Ränge 4 Wochen, 8 Wochen und 12 Wochen nach Beginn der medikamentösen Behandlung unterschiedet. Es gibt keine signifikanten Unterschiede in den mittleren Rängen des „Acne Severity Scores“ zwischen 4 Wochen, 8 Wochen und 12 Wochen nach Beginn der medikamentösen Behandlung.

4. SPSS-Befehle

SPSS-Datensatz: Verwendeter Beispieldatensatz zum Friedman-Test.sav

Klicksequenz: Analysieren > Nichtparametrische Tests > k verbundene Stichproben

Syntax: NPAR TESTS FRIEDMAN

5. Literatur

Field, A. (2009). Discovering Statistics Using SPSS. London: Sage.
Gravetter, F. J. & Wallnau, L. B. (2009). Statistics for the behavioral sciences. Belmont: Wadsworth Cengage Learning.

top