Ressourcen für empirische Methoden

Einfaktorielle Varianzanalyse


entscheidbaum


1. Einführung
2. Vorgehensweise
3. Einfaktorielle Varianzanalyse mit Messwiederholung mit SPSS
4. SPSS-Befehle
5. Literatur

1. Einführung

Die Varianzanalysen (ANOVA = „Analysis of Variance“) gehören zu den insbesondere in den Sozialwissenschaften am häufigsten eingesetzten statistischen Verfahren. Es gibt verschiedene Arten von Varianzanalysen, die sich in der Anzahl der unabhängigen Variablen sowie im Vorhandensein bzw. Nichtvorhandensein von Messwiederholungen unterscheiden. Im vorliegenden Kapitel wird auf die einfaktorielle Varianzanalyse mit Messwiederholung eingegangen, die Mittelwertsunterschiede zu verschiedenen Messzeitpunkten von drei oder mehr unterschiedlichen Gruppen (oder Stichproben) untersucht. Dazu werden wiederholt Messungen an denselben Untersuchungseinheiten durchgeführt, wobei es sich um Messungen zu verschiedenen Zeiten oder um mehrfache Behandlungen (z.B. Medikamente A, B, C) handeln kann. Die abhängige Variable sollte dabei intervallskaliert sowie annähernd normalverteilt sein. Die unabhängige Variable ist üblicherweise nominalskaliert und wird als „Faktor“ bezeichnet.

2. Vorgehensweise

Mit folgender Fragestellung wird im vorliegenden Kapitel die Vorhergehensweise bei der einfaktoriellen Varianzanalyse mit Messwiederholung näher erläutert:

Gibt es bei Ehemännern Unterschiede in den Werten auf der „Desire to Express Worry“-Skala zu verschiedenen Messzeitpunkten (gleich nach der Hochzeit, nach 5, 10 und 15 Ehejahren)?

Der Ablauf der einfaktoriellen Varianzanalyse mit Messwiederholung wird in der Literatur fünf Schritten zusammengefasst, die im Folgenden beschrieben werden.

2.1 Schematische Darstellung

Die Fragestellung wird anhand eines Datensatzes der „University of Canberra” untersucht. Es handelt sich um die Daten von 30 Ehemännern, die den „Desire to Express Worry“-Fragebogen zu verschiedenen Messzeitpunkten ausgefüllt haben. Die Untersuchung möchte ausfindig machen, ob die Dauer der Ehe einen Einfluss darauf haben könnte, in welchem Mass Männer den Ehefrauen Sorgen mitteilen wollen. Zur Beantwortung der Fragestellung kann eine schematische Darstellung hilfreich sein, die im vorliegenden Fall folgendermassen aussieht:

Abbildung 1: Schematische Darstellung . Anmerkung: DEW = „Desire to Express Worry“

Abbildung 1: Schematische Darstellung . Anmerkung: DEW = „Desire to Express Worry“

Die schematische Darstellung besagt, dass sich die Mittelwerte der „Desire to Express Worry“-Skala zu verschiedenen Messzeitpunkten (1 = „initially after marriage“, 2 = „after 5 years of marriage“, 3 = „after 10 years of marriage “ und 4 = „after 15 years of marriage “) unterschieden könnten. Die Nullhypothese der Varianzanalyse mit Messwiederholung lautet im Allgemeinen:

Abbildung 2: Nullhypothese der Varianzanalyse mit Messwiederholung mit vier Messzeitpunkten

Abbildung 2: Nullhypothese der Varianzanalyse mit Messwiederholung mit vier Messzeitpunkten

Die Alternativhypothese besagt, dass die Nullhypothese nicht gültig ist, bzw. dass es Mittelwertsunterschiede gibt.

2.2 Berechnung der Teststatistik

Der Beispieldatensatz umfasst 30 Probanden (in diesem Fall Ehemänner), die an vier Messzeitpunkten untersucht wurden. In Tabelle 1 sind die Rohdaten, sowie die Mittelwerte und Standardabweichungen abgebildet (nach Messzeitpunkten getrennt):

Tabelle 1: Beispieldaten. Anmerkung: M = Mittelwert; SD = Standardabweichung

Tabelle 1: Beispieldaten. Anmerkung: M = Mittelwert; SD = Standardabweichung

In Kapitel 3 („ Einfaktorielle Varianzanalyse mit Messwiederholung mit SPSS“) wird erläutert, wie in SPSS einen Faktor festgelegt werden kann.

Zur Veranschaulichung der Mittelwerte kann mit SPSS durch das Auswählen von „Diagrammen“ im Dialogfeld der einfaktoriellen ANOVA mit Messwiederholung ein Diagramm erstellt werden (unter „Horizontale Achse“ wird „Faktor 1“ hinzugefügt).

Abbildung 3: Graphische Darstellung der Mittelwerte. Anmerkung: 1 = gleich nach Hochzeit; 2 = nach 5 Ehejahren; 3 = nach 10 Ehejahren; 4 = nach 15 Ehejahren

Abbildung 3: Graphische Darstellung der Mittelwerte. Anmerkung: 1 = gleich nach Hochzeit; 2 = nach 5 Ehejahren; 3 = nach 10 Ehejahren; 4 = nach 15 Ehejahren

Wie in Abbildung 3 gezeigt wird, unterscheiden sich die Mittelwerte der „Desire to Express Worry“-Skala an den verschiedenen Messzeitpunkten. Anhand der einfaktoriellen Varianzanalyse mit Messwiederholung kann, nach der Berechnung der dazugehörigen Teststatistik, überprüft werden, ob diese Mittelwertsunterschiede statistisch signifikant sind.

Die Grundidee der Varianzanalyse mit Messwiederholung ist die gleiche wie bei der Varianzanalyse ohne Messwiederholung und beruht auf die Zerlegung der gesamten Stichprobenvarianz der abhängigen Variablen. Da die Gruppen aus denselben Untersuchungseinheiten bestehen, ist die Streuung zwischen den Gruppen bei der Varianzanalyse mit Messwiederholung nicht von Interesse. Die Gesamtstreuung wird berechnet, indem die Streuung zwischen Untersuchungseinheiten und innerhalb von Untersuchungseinheiten aufsummiert werden:

Abbildung 4: Berechnung der Gesamtstreuung

Abbildung 4: Berechnung der Gesamtstreuung

wobei
SS= Summe der Abweichungsquadrate („sum of squares“)
zw= zwischen Untersuchungseinheiten
in=innerhalb von Untersuchungseinheiten

Die Gesamtstreuung kann auch mit folgender Gleichung beschrieben werden:

Abbildung 5: Gesamtstreuung (komplette Formel)

Abbildung 5: Gesamtstreuung (komplette Formel)

wobei
SS= Summe der Abweichungsquadrate („sum of squares“)
j = Faktorstufe (Ausprägung der Faktoren)
k=Anzahl Faktorstufen
n=Stichprobengrösse
ȳ=Gesamtmittelwert
yij=Merkmalsausprägung der i-ten Untersuchungseinheit in der
Faktorstufe j

SSzw beschreibt die Unterschiede zwischen den Untersuchungseinheiten und wird folgendermassen berechnet:

Abbildung 6: Gleichung der Streuung zwischen den Untersuchungseinheiten

Abbildung 6: Gleichung der Streuung zwischen den Untersuchungseinheiten

wobei
SS= Summe der Abweichungsquadrate („sum of squares“)
k=Anzahl Faktorstufen
n=Stichprobengrösse innerhalb einer Faktorstufe
pi=Mittelwert aller Messwerte der i-ten Untersuchungseinheit
ȳ=Gesamtmittelwert

SSin beschreibt die Unterschiede einer Untersuchungseinheit zwischen den verschiedenen Messzeitpunkten und wird folgendermassen berechnet:

Abbildung 7: Gleichung der Streuung innerhalb von Untersuchungseinheiten

Abbildung 7: Gleichung der Streuung innerhalb von Untersuchungseinheiten

wobei
SS= Summe der Abweichungsquadrate („sum of squares“)
j = Faktorstufe (Ausprägung der Faktoren)
k=Anzahl Faktorstufen
n=Stichprobengrösse innerhalb einer Faktorstufe
pi=Mittelwert aller Messwerte der i-ten Untersuchungseinheit
yij=Merkmalsausprägung der i-ten Untersuchungseinheit in der
Faktorstufe j

SSin kann zudem in die Treatment- und die Residualstreuung zerlegt werden:

Abbildung 8: Gleichung der Zerlegung der Streuung innerhalb von Untersuchungseinheiten

Abbildung 8: Gleichung der Zerlegung der Streuung innerhalb von Untersuchungseinheiten

Die Treatmentstreuung beschreibt die Unterschiede der Untersuchungseinheiten zwischen den verschiedenen Messzeitpunkten und wird folgendermassen berechnet:

Abbildung 9: Gleichung der die Treatmentstreuung

Abbildung 9: Gleichung der die Treatmentstreuung

wobei
SS=Summe der Abweichungsquadrate („sum of squares“)
j=Faktorstufe (Ausprägung der Faktoren)
k=Anzahl Faktorstufen
n=Stichprobengrösse
ȳj=Mittelwert der Faktorstufe j
ȳ=Gesamtmittelwert

Es kann zudem Unterschiede geben, die durch die Interaktion von Messzeitpunkt und Untersuchungseinheit entstehen und folgendermassen beschrieben werden:

Abbildung 10: Gleichung der die Residualstreuung

Abbildung 10: Gleichung der die Residualstreuung

wobei
SS= Summe der Abweichungsquadrate („sum of squares“)
j = Faktorstufe (Ausprägung der Faktoren)
k=Anzahl Faktorstufen
n=Stichprobengrösse
yij=Merkmalsausprägung der i-ten Untersuchungseinheit in der
Faktorstufe j
ȳj=Mittelwert der Faktorstufe j
pi=Mittelwert aller Messwerte der i-ten Untersuchungseinheit
ȳ=Gesamtmittelwert

In folgender Tabelle sind die Freiheitsgrade angezeigt, mit denen die einzelnen Streuungen normiert werden, um die entsprechenden Varianzen zu erhalten:

Tabelle 2: Freiheitsgrade

Tabelle 2: Freiheitsgrade

Die F-Teststatistik wird aus dem Verhältnis von Treatmentvarianz zu Residualvarianz berechnet:

Abbildung 11: Berechnung der Teststatistik

Abbildung 11: Berechnung der Teststatistik

Die F-verteilte Teststatistik wird mit dem kritischen Wert auf der durch die Freiheitsgrade bestimmten theoretischen F-Verteilung verglichen.

2.3 Test auf Sphärizität

Als Voraussetzung für die Durchführung einer einfaktoriellen Varianzanalyse mit Messwiederholung gilt, dass die Varianzen der Mittelwertsdifferenzen zwischen den Messzeitpunkten homogen sind (wird als Sphärizität bezeichnet). Vor der Berechnung der Varianzanalyse muss ein Test auf Sphärizität durchgeführt werden, der in SPSS automatisch berechnet wird.

Bei den Beispieldaten gibt SPSS für den Test auf Sphärizität einen p-Wert von .001 aus (siehe Kapitel 3: „Einfaktorielle Varianzanalyse mit Messwiederholung mit SPSS“). In der Literatur wird beschrieben, dass der p-Wert des Tests auf Sphärizität grösser als .100 sein soll. Der p-Wert der Beispieldaten deutet darauf hin, dass keine Sphärizität vorliegt und dass deshalb die Voraussetzung der einfaktoriellen Varianzanalyse mit Messwiederholung nicht erfüllt ist. Bei Verletzung der Voraussetzung der Sphärizität führt SPSS automatisch eine Korrektur bzw. Anpassung der Freiheitsgrade durch (beispielsweise nach Greenhouse-Geisser), aufgrund dessen die weitere Berechnungen ermöglicht werden.

2.4 Prüfung auf Signifikanz

In diesem Abschnitt wird die berechnete Teststatistik auf Signifikanz überprüft. Der F-Wert wird mit dem kritischen Wert der theoretischen F-Verteilung verglichen.

Für die Beispieldaten wird in SPSS eine Prüfgrösse F von 7.664 und einen p-Wert von .001 angezeigt (siehe Kapitel 3: „Einfaktorielle Varianzanalyse mit Messwiederholung mit SPSS“). Die Voraussetzung der Sphärizität bei den Beispieldaten ist nicht erfüllt. Wenn das „Greenhouse-Geisser“-Epsilon grösser als .750 ist, soll der p-Wert unter „Huynh-Feldt“ berücksichtigt werden. Im vorliegenden Beispiel ist das „Greenhouse-Geisser“-Epsilon kleiner als .750. Es wird demnach der p-Wert unter „Greenhouse-Geisser“ berücksichtigt, der kleiner als das Signifikanzniveau von .050 ist. Die Nullhypothese kann zugunsten der Alternativhypothese abgelehnt werden. Es gibt signifikante Mittelwertsunterschiede in der „Desire to Express Worry“-Skala der Ehemänner an mindestens zwei Messzeitpunkten.

Da die Varianzanalyse mit Messwiederholung nur untersucht, ob mindestens ein Unterschiede vorliegt, werden anschliessend Post Hoc Tests durchgeführt, um zu überprüfen, welche Mittelwerte signifikant von den anderen abweichen.

2.5 Post Hoc Tests

Die Varianzanalyse mit Messwiederholung gibt keine Auskunft darüber, welche Mittelwerte sich signifikant von den anderen unterscheiden.

Dazu können Post Hoc Tests berechnet werden, die durch paarweise Vergleiche der Gruppen prüfen, welche Mittelwertsunterschiede dazu geführt haben, dass die Varianzanalyse mit Messwiederholung signifikant ist. Dazu werden t-Tests für verbundene Stichproben durchgeführt. Für das Beispiel werden insgesamt 6 Vergleiche gerechnet (A&B, A&C, A&D, B&C, B&D und C&D).

Die Wahrscheinlichkeit einen Fehler 1. Art zu begehen (die irrtümliche Annahme der Alternativhypothese) steigt mit der Anzahl der durchgeführten Tests. Zur Behebung dieses Problems wird das Signifikanzniveau mit der Anzahl der durchgeführten Tests korrigiert. In SPSS kann diese Korrektur durch das Auswählen von „Haupteffekte vergleichen“ im Dialogfenster „Messwiederholung“ unter „Optionen“ durchgeführt werden, indem unter „Anpassung des Konfidenzintervalls“ die Bonferroni Prozedur ausgewählt wird.

3. Einfaktorielle Varianzanalyse mit Messwiederholung mit SPSS

Im Folgenden wird erläutert, wie in SPSS ein Faktor für die Messwiederholung festgelegt werden kann.

Abbildung 12: Festlegung des Faktors und der „Anzahl der Stufen“

Abbildung 12: Festlegung des Faktors und der „Anzahl der Stufen“

Im Dialogfenster „Messwiederholung“ kann unter „Name des Innersubjektfaktors“ dem Faktor ein Label gegeben werden. Unter „Anzahl der Stufen“ wird die Anzahl der Messwiederholungen definiert.

Abbildung 13: Festlegung der Innersubjektvariablen

Abbildung 13: Festlegung der Innersubjektvariablen

Nach der Festlegung der Anzahl der Faktorstufen wird unter „Innersubjektvariablen“ in chronologischer Reihenfolge jedem Messzeitpunkt eine Stufe zugewiesen.

SPSS gibt bei der Berechnung der einfaktoriellen Varianzanalyse mit Messwiederholung unter anderem die folgenden Abbildungen aus:

Abbildung 14: Test auf Sphärizität

Abbildung 14: Test auf Sphärizität

In Abbildung 14 ist der Mauchly-Test auf Sphärizität angezeigt. Ein signifikantes Ergebnis deutet darauf hin, dass keine Sphärizität vorliegt und die Voraussetzung der Varianzanalyse nicht erfüllt ist. SPSS führt automatisch eine Korrektur bzw. Anpassung der Freiheitsgrade durch (Greenhouse-Geisser- und Huynh-Feldt-Korrektur), aufgrund dessen die weiteren Berechnungen ermöglicht werden.

Abbildung 15: Teststatistiken und p-Werte

Abbildung 15: Teststatistiken und p-Werte

In Abbildung 15 ist das Ergebnis der einfaktoriellen Varianzanalyse mit Messwiderholung angezeigt. Da bei den Beispieldaten keine Sphärizität angenommen werden kann und das „Greenhouse-Geisser“-Epsilon nicht grösser als .750 ist (siehe Abbildung 14), ist die Korrektur nach „Greenhouse-Geisser“ relevant (siehe rote Markierung in Abbildung 15). Im vorliegenden Fall beträgt der F-Wert 7.664 und der dazugehörige p-Wert .001. Mindestens ein Mittelwertsunterschied zwischen den Messzeitpunkten ist signifikant. Spezifische Aussagen über die Unterschiede können erst nach der Durchführung der Post Hoc Tests gemacht werden.

Abbildung 16: Post Hoc - Tests

Abbildung 16: Post Hoc – Tests

In Abbildung 16 gibt die erste Spalte die Mittelwertsunterschiede zwischen den jeweiligen Messzeitpunkten an, wobei die p-Werte der dritten Spalte relevant sind. Die p-Werte wurden anhand der Bonferroni-Korrektur angepasst.
Im vorliegenden Beispiel unterscheidet sich der Mittelwert der Ehemänner auf der „Desire to Express Worry“-Skala gleich nach der Hochzeit mit den Mittelwerten nach 10 sowie nach 15 Ehejahren. Zudem unterscheidet sich der Mittelwert der „Desire to Express Worry“-Skala nach 5 Ehejahren mit den Mittelwerten nach 10 sowie nach 15 Ehejahren (siehe rote Markierungen in Abbildung 16). Da die ausgegebenen p-Werte dieser Vergleiche kleiner als .050 sind, handelt es sich um signifikante Mittelwertsunterschiede (die Richtung der Mittelwertsunterschiede ist im Diagramm in Abbildung 3 angezeigt). Je länger die Dauer der Ehe, desto kleiner ist die Wahrscheinlichkeit, dass Ehemänner dazu motiviert sind, gegenüber den Ehefrauen eigene Sorgen zum Ausdruck zu bringen.

4. SPSS-Befehle

SPSS-Datensatz: Verwendeter Beispieldatensatz zum Einfaktorielle-Varianzanalyse.sav

Klicksequenz: Analysieren > allgemeines lineares Modell > Messwiederholung
Unter „Faktor“ Anzahl der Stufen (Messzeitpunkte) definieren.

Syntax:
GLM initially years5 years10 years15
/WSFACTOR=Faktor1 4 Polynomial
/MEASURE=Messzeitpunkt
/METHOD=SSTYPE(3)
/PLOT=PROFILE(Faktor1)
/EMMEANS=TABLES(Faktor1) COMPARE ADJ(BONFERRONI)
/PRINT=DESCRIPTIVE
/CRITERIA=ALPHA(.05)
/WSDESIGN=Faktor1.

5. Literatur

Field, A. (2009). Discovering statistics using SPSS. London: Sage Publications, Inc.
Gravetter, F. J. & Wallnau, L. B. (2009). Statistics for the behavioral sciences. Belmont: Wadsworth Cengage Learning.
Welkowitz, J., Cohen, B.H. & Ewen, R.B. (2006). Introductory Statistics for the Behavioural Sciences. New Jersey: John Wiley and Sons.

top