Ressourcen für empirische Methoden

Pearson-Chi-Quadrat-Verteilungstest


entscheidbaum


1. Einführung
2. Vorgehensweise
3. Pearson-Chi-Quadrat-Verteilungstest mit SPSS
4. SPSS-Befehle
5. Literatur

1. Einführung

Der Chi-Quadrat-Verteilungstest ist ein nicht-parametrisches statistisches Verfahren mit Chi-Quadrat-verteilter Teststatistik, der beobachtete Häufigkeiten mit erwarteten Häufigkeiten vergleicht. Dabei wird beispielsweise getestet, ob die beobachtete Verteilung der Ausprägungen einer Variablen mit einer theoretischen Verteilung übereinstimmt. Die untersuchten Variablen können jedes beliebiges Skalenniveau und aufweisen.

2. Vorgehensweise

Mit folgender Fragestellung wird im vorliegenden Kapitel die Vorhergehensweise beim Chi-Quadrat-Verteilungstest näher erläutert:

Unterscheiden sich die Häufigkeiten des Auftretens der vier Blutgruppenmerkmale (A, 0, B und AB) zwischen einem Bergdorf und der gesamten Schweiz?

Der Ablauf des Chi-Quadrat-Verteilungstest wird in drei Schritten zusammengefasst, die im Folgenden beschrieben werden.

2.1 Bestimmung der erwarteten Häufigkeiten

Beim Chi-Quadrat-Verteilungstest werden beobachtete Häufigkeiten mit erwarteten Häufigkeiten verglichen. In den Voreinstellungen von SPSS wird davon ausgegangen, dass sämtliche Ausprägungen gleich häufig auftreten. Falls sich die erwartete Auftretenswahrscheinlichkeit der Kategorien aufgrund von theoretischen Annahmen unterscheiden, kann dies in SPSS manuell eingestellt werden.

Der Chi-Quadrat-Verteilungstest wird im vorliegenden Beispiel mit einem Datensatz durchgeführt, der die Blutgruppenmerkmale der 127 Einwohnern eines hypothetischen, schweizerischen Bergdorfes enthält. Dabei weisen insgesamt 52 Einwohner das Blutgruppenmerkmal A, 44 das Blutgruppenmerkmal 0, 21 das Blutgruppenmerkmal B und 10 das Blutgruppenmerkmal AB auf. Die landesweite Häufigkeiten der Blutgruppenmerkmale in der Schweiz sind bekannt: A kommt bei 47% der Bevölkerung, 0 bei 41% der Bevölkerung, B bei 8% der Bevölkerung und AB bei 4% der Bevölkerung vor. In einer Gruppe von 127 Personen würden demnach das Blutgruppenmerkmal A eine erwartete absolute Häufigkeit von 59.69, das Blutgruppenmerkmal 0 eine erwartete absolute Häufigkeit von 52.07, das Blutgruppenmerkmal B eine erwartete absolute Häufigkeit von 10.16 und das Blutgruppenmerkmal AB eine erwartete absolute Häufigkeit von 5.08 aufweisen.

2.2 Berechnung der Teststatistik

Die Berechnung der Teststatistik des Chi-Quadrat-Verteilungstests beruht auf den Vergleich der beobachteten Häufigkeiten und den erwarteten Häufigkeiten und wird folgendermassen berechnet:

Abbildung 1: Berechnung der Chi-Quadrat-Teststatistik

Abbildung 1: Berechnung der Chi-Quadrat-Teststatistik

wobei
k= Anzahl der Ausprägungskategorien
fb= beobachtete absolute Häufigkeit in der Ausprägungskategorie j
fe= erwartete absolute Häufigkeit in der Ausprägungskategorie j

Wenn sämtliche Ausprägungskategorien eine erwartete Häufigkeit von mindestens 5 Einheiten aufweisen, ist die Teststatistik nahezu Chi-Quadrat-verteilt (mit k – 1 Freiheitsgraden). Falls Ausprägungskategorien mit erwarteten Häufigkeiten von weniger als 5 Einheiten vorhanden sind, ist es empfehlenswert, basierend auf inhaltliche Überlegungen, benachbarte Kategorien zusammenzulegen.

Im vorliegenden Beispiel sind die erwarteten Häufigkeiten sämtlicher Ausprägungskategorien grösser als 5.

2.3 Prüfung auf Signifikanz

In diesem Abschnitt wird die berechnete Teststatistik auf Signifikanz überprüft. Der berechnete Wert wird mit dem kritischen Wert auf der Chi-Quadrat-Verteilung verglichen, die durch den Freiheitsgrad bestimmt wird.

Im vorliegenden Beispiel gibt SPSS eine Chi-Quadrat Teststatistik von 18.572 und einen p-Wert von .000 aus (siehe Kapitel 3: „Chi-Quadrat-Verteilungstest mit SPSS“). Dieser Wert ist kleiner als .050, gibt es Unterschiede in den Häufigkeiten des Auftretens der vier Blutgruppenmerkmale (A, 0, B und AB) zwischen dem Bergdorf und der gesamten Schweiz.

3. Pearson-Chi-Quadrat-Verteilungstest mit SPSS

SPSS gibt bei der Berechnung des Chi-Quadrat-Verteilungstests folgende Abbildungen aus:

Abbildung 2: Hypothesentestübersicht

Abbildung 2: Hypothesentestübersicht

In Abbildung 2 ist die Übersicht über den Hypothesentest der Beispieldaten angezeigt. Die Nullhypothese, die besagt, dass sich die beobachtete Verteilung der vier Blutgruppenmerkmale (A, 0, B und AB) in einem Bergdorf nicht von der erwarteten Verteilung der gesamten Schweiz unterschiedet, wird zugunsten der Alternativhypothese abgelehnt.

Abbildung 3: Kreuztabelle der Bespieldaten

Abbildung 3: Kreuztabelle der Bespieldaten

In Abbildung 3 sind die beobachtete und die erwartete Verteilungen (siehe unter „Hypothese“) dargestellt. Zudem sind die Chi-Quadrat Teststatistik und der dazugehörige p-Wert angezeigt. Da der ausgegebene p-Wert kleiner als das Signifikanzniveau von .050 ist, unterscheidet sich die beobachtete Verteilung von der erwarteten Verteilung. Die Darstellung in Abbildung 3 kann in den neuen SPSS-Versionen (ab SPSS 19) durch das Doppelklicken von „Übersicht über Hypothesentest“ geöffnet werden.

4. SPSS-Befehle

SPSS-Datensatz: Verwendeter Beispieldatensatz zum Chi-Quadrat-Verteilungstest.sav

Klicksequenz: Analysieren > Nichtparametrische Tests > Eine Stichprobe > Beobachtete und hypothetische Wahrscheinlichkeiten vergleichen (Chi-Quadrat-Test)

Erwartete Häufigkeiten definieren: Unter „Optionen > „Erwartete Wahrscheinlichkeit anpassen“

Syntax: NPAR TESTS CHISQUARE

5. Literatur

Field, A. (2009). Discovering statistics using SPSS. London: Sage Publications, Inc.
Gravetter, F. J. & Wallnau, L. B. (2009). Statistics for the behavioral sciences. Belmont: Wadsworth Cengage Learning.

top