Ressourcen für empirische Methoden

F-Test


entscheidbaum


1. Einführung
2. Vorgehensweise
3. Levene-Test mit SPSS
4. SPSS-Befehle
5. Literatur

1. Einführung

Der F-Test ist ein statistisches Verfahren, bei dem die Teststatistik F-verteilt ist. Der F-Test dient der Überprüfung, ob sich die Varianzen zweier Stichproben (oder Gruppen) voneinander unterscheiden. Die abhängige Variable soll mindestens ordinalskaliert und normalverteilt sein.

Der F-Test oder dem F-Test verwandte Verfahren werden eingesetzt, um beispielsweise bei den Varianzanalysen die Voraussetzung der Varianzhomogenität zu überprüfen.

2. Vorgehensweise

Mit folgender Fragestellung wird im vorliegenden Kapitel die Vorhergehensweise beim F-Test näher erläutert:

Unterscheidet sich die Varianz der Internetnutzung (in Stunden pro Woche) zwischen Frauen und Männern?

Der Ablauf des F-Tests wird in drei Schritten zusammengefasst, die im Folgenden beschrieben werden.

2.1 Modellformulierung

Die Fragestellung wird anhand einer zufallsgenerierten Teilstichprobe (n = 652 erwachsene US-BürgerInnen) der „General Social Survey (GSS)“ des Jahres 2000 untersucht.

Zur Beantwortung der Fragestellung kann die Erstellung eines Modells hilfreich sein, das im vorliegenden Fall folgendermassen aussieht:

Abbildung 1: Beispielmodell

Abbildung 1: Beispielmodell

Im vorliegenden Beispiel wurde die abhängige Variable „Internetnutzung“ (in Stunden pro Woche) nach den Geschlechtern getrennt berücksichtigt.

2.2 Berechnung der Teststatistik

Der Beispieldatensatz umfasst 305 Männer und 347 Frauen. In Tabelle 1 sind die Mittelwerte und Standardabweichungen der abhängigen Variable „Internetnutzung“ beider Geschlechter abgebildet:

Tabelle 1: Beispieldaten. Anmerkung: N= Stichprobengrösse; M = Mittelwert; SD = Standardabweichung

Tabelle 1: Beispieldaten. Anmerkung: N= Stichprobengrösse; M = Mittelwert; SD = Standardabweichung

Die Standardabweichung der abhängigen Variable „Internetnutzung“ beträgt bei den Männern 7.80 und bei den Frauen 5.86. Der F-Test überprüft, ob der Unterschied der Varianzen signifikant ist. Die Varianz entspricht dem Quadrat der Standardabweichung.

Bei der Teststatistik handelt es sich im vorliegenden Fall um die F-Statistik mit den theoretischen F-Verteilungen und die dazugehörigen Freiheitsgrade, anhand derer überprüft wird, ob der Unterschied der Varianzen signifikant ist.

Die Teststatistik des F-Tests wird folgendermassen berechnet:

Abbildung 2: Berechnung des F-Wertes

Abbildung 2: Berechnung des F-Wertes

wobei
σ1²= Varianz der ersten Stichprobe
σ2²= Varianz der zweiten Stichprobe

Der Wert von F beträgt 1 bei identischen Varianzen der beiden Stichproben und ist entweder grösser oder kleiner als 1 bei unterschiedlichen Varianzen der beiden Stichproben.

Mit SPSS kann der F-Test nicht direkt durchführt werden. Bei der Berechnung der einfaktoriellen Varianzanalyse kann im Dialogfeld unter den „Optionen“ durch das Auswählen von „Test auf Homogenität der Varianzen“ der Levene-Test berechnet werden, der eine Alternative zum „klassischen“ F-Test darstellt. Der Levene-Test ist robuster gegenüber der Verletzung der Normalverteilung der abhängigen Variablen und kann auch bei mehr als zwei Stichproben angewendet werden.

Im Folgenden wird auf die manuelle Berechnung des F-Tests eingegangen (siehe Kapitel 3: „Levene mit SPSS“ für die computergestützte Berechnung). Der F-Wert wird im vorliegenden Beispiel folgendermassen berechnet:

Abbildung 3: Berechnung des F-Wertes im vorliegenden Beispiel

Abbildung 3: Berechnung des F-Wertes im vorliegenden Beispiel

Dieser F-Wert wird anschliessend mit dem kritischen Wert auf der durch die Freiheitsgrade bestimmten theoretischen F-Verteilung verglichen.

2.3 Prüfung auf Signifikanz

In diesem Abschnitt wird die berechnete Teststatistik auf Signifikanz überprüft. Für den Vergleich des berechneten F-Wertes mit dem kritischen Wert sind die Zählerfreiheitsgrade und die Nennerfreiheitsgrade relevant, die durch das Verringern der Stichprobengrössen um eins (nx – 1) gebildet werden. Die kritischen Werte können in den F-Tabellen nachgeschlagen werden.

Tabelle 2: Auszug einer F-Tabelle (Bortz & Schuster, 2010)

Tabelle 2: Auszug einer F-Tabelle (Bortz & Schuster, 2010)

Im vorliegenden Beispiel beträgt der Zählerfreiheitsgrad 346 (347-1) und der Nennerfreiheitsgrad 304 (305-1). Da diese Freiheitsgrade nicht in der Tabelle vorkommen, wird der kritische Wert in der nächstliegenden Spalte bzw. Zeile abgelesen, die durch kleinere Freiheitsgrade definiert sind (in diesem Fall: df1= 200 und df2= 200). In der F-Tabelle sind die kritischen Werte der Signifikanzniveaus .25, .10, .50 und .01 absteigend eingetragen. Im vorliegenden Beispiel wird ein Signifikanzniveau von .05 gewählt, wobei der relevante kritische Wert 1.26 beträgt (siehe rote Markierungen in Tabelle 2). Der berechnete Testwert ist grösser als der kritische Wert (1.77 > 1.26). Es kann davon ausgegangen werden, dass sich die Varianzen der beiden Geschlechter signifikant voneinander unterscheiden.

3. Levene-Test mit SPSS

SPSS gibt bei der Berechnung der einfaktoriellen Varianzanalyse (beim „Auswählen“ von „Test auf Homogenität der Varianzen“ unter den „Optionen“) folgende Abbildung aus:

Abbildung 4: Levene-Test auf Varianzhomogenität

Abbildung 4: Levene-Test auf Varianzhomogenität

In Abbildung 4 ist der Levene-Tests angezeigt. Da der ausgegebene p-Wert kleiner als .050 ist, kann davon ausgegangen werden, dass sich die Varianzen der beiden Geschlechter signifikant voneinander unterscheiden. Die Varianz der Internetnutzung (in Stunden pro Woche) der Männer ist signifikant grösser als die der Frauen. Der berücksichtigte Datensatz deutet zudem darauf hin, dass es Unterschiede in den Mittelwerten der Internetnutzung zwischen den Geschlechter gibt (auf deren Berechnung wird an dieser Stelle nicht näher eingegangen). Männer verbringen im Vergleich zu den Frauen signifikant mehr Stunden pro Woche im Internet.

4. SPSS-Befehle

SPSS-Datensatz: Verwendeter Beispieldatensatz zum F-Test.sav

Klicksequenz: Analysieren > Mittelwerte vergleichen > Einfaktorielle ANOVA
Unter “Optionen“ > „Test auf Homogenität der Varianzen“ auswählen

Syntax:
ONEWAY AV BY UV
/STATISTICS HOMOGENEITY
/MISSING ANALYSIS.

5. Literatur

Field, A. (2009). Discovering Statistics Using SPSS. London: Sage.
Bortz, J. & Schuster, C. (2010). Statistik für Human- und Sozialwissenschaftler. Berlin: Springer.

top