Ressourcen für empirische Methoden

Chi-Quadrat


entscheidbaum


1. Einführung
2. Vorgehensweise
3. Chi-Quadrat-Test für die Varianz mit SPSS
4. SPSS-Befehle
5. Literatur

1. Einführung

Der Chi-Quadrat-Test für die Varianz ist ein nicht-parametrisches statistisches Verfahren mit Chi-Quadrat-verteilter Teststatistik und dient der Überprüfung, ob die Varianz einer Variable, die in einer bestimmten Stichprobe erhoben wird, gleich gross ist wie die bekannte Populationsvarianz derselben Variablen. Um die Populationsvarianz zu ermitteln, ist es nicht notwendig, die komplette Grundgesamtheit zu untersuchen. Oftmals ist es ausreichend, die Populationsvarianz anhand einer geeichten oder repräsentativen Stichprobe ausfindig zu machen. Die untersuchte Variable kann beim Chi-Quadrat-Test jedes beliebiges Skalenniveau aufweisen.

2. Vorgehensweise

Mit folgender Fragestellung wird im vorliegenden Kapitel die Vorhergehensweise beim Chi-Quadrat-Test für die Varianz näher erläutert:

Unterscheidet sich die Varianz der Wartezeit der Passagiere einer Fluggesellschaft, wenn die Reisenden für das Check-In in nach Schalter getrennten Warteschlangen oder aber in einer einzigen grossen Warteschlange anstehen?

Der Ablauf des Chi-Quadrat-Tests für die Varianz wird in drei Schritten zusammengefasst, die im Folgenden beschrieben werden.

2.1 Schematische Darstellung

Die Kunden einer hypothetischen Fluggesellschaft stehen üblicherweise in einer einzigen grossen Warteschlange an, um beim Check-In das mitgeführte Gepäck abzugeben. Die durchschnittliche Varianz der Wartezeit in einer einzigen grossen Warteschlange ist bekannt, die im vorliegenden Beispiel die Populationsvarianz darstellt. In einem Pilotversuch mit 27 Passagieren wurden nach Schalter getrennte Warteschlangen gebildet. Dabei wurde die durchschnittliche Varianz der Wartezeit bei getrennten Warteschlangen erfasst, die im vorliegenden Beispiel die Stichprobenvarianz darstellt. Zur Beantwortung der Fragestellungen kann eine schematische Darstellung hilfreich sein, die im vorliegenden Fall folgendermassen aussieht:

Abbildung 1: Schematische Darstellung

Abbildung 1: Schematische Darstellung

Im vorliegenden Beispiel wurde die abhängige Variable „Wartezeit“ (in Minuten) berücksichtigt.

2.2 Berechnung der Teststatistik

Im vorliegenden Beispiel beträgt die durchschnittliche Standardabweichung der Wartezeit in einer einzigen Warteschlange 4.7 Minuten. Die Populationsvarianz beträgt demnach 22.09 (Quadrat der Standardabweichung). Die durchschnittliche Standardabweichung der Wartezeit in getrennten Warteschlangen des Pilotversuchs mit 27 Passagieren beträgt 8.1 Minuten. Die Stichprobenvarianz beträgt demnach 65.61 (Quadrat der Standardabweichung).

Die Teststatistik des Chi-Quadrat-Tests für die Varianz wird folgendermassen berechnet:

Abbildung 2: Berechnung der Chi-Quadrat-Teststatistik für die Varianz

Abbildung 2: Berechnung der Chi-Quadrat-Teststatistik für die Varianz

wobei
n= Stichprobengrösse
s2= Stichprobenvarianz
σ²= Populationsvarianz

Bei den Beispieldaten ergibt die Berechnung der Teststatistik folgendes Resultat:

Abbildung 3: Berechnung der Teststatistik der Beispieldaten

Abbildung 3: Berechnung der Teststatistik der Beispieldaten

Die Chi-Quadrat-Teststatistik des vorliegenden Beispiels beträgt 77.22.

2.3 Prüfung auf Signifikanz

In diesem Abschnitt wird die berechnete Teststatistik auf Signifikanz überprüft. Der berechnete Wert wird mit dem kritischen Wert auf der Chi-Quadrat-Verteilung verglichen, die durch den Freiheitsgrad bestimmt wird.

Die Hypothese ist im vorliegenden Beispiel ungerichtet. Es wird überprüft, ob Unterschiede vorhanden sind und nicht, in welche Richtung vermutete Unterschiede gehen (z.B. welche Varianz kleiner bzw. grösser ist).

Die kritischen Werte können in den Chi-Quadrat-Tabellen nachgeschlagen werden.

Tabelle 1: Auszug einer Chi-Quadrat-Tabelle

Tabelle 1: Auszug einer Chi-Quadrat-Tabelle

In der F-Tabelle sind die kritischen Werte verschiedener Signifikanzniveaus eingetragen. Der Freiheitsgrad beträgt im vorliegenden Beispiel n – 1 = 27 – 1 = 26. Es wird ein Signifikanzniveau von .05 gewählt, wobei der relevante kritische Wert 38.89 beträgt (siehe rote Markierung in Tabelle 1). Der berechnete Testwert ist grösser als der kritische Wert (77.22 > 38.89). Es kann davon ausgegangen werden, dass sich die Varianzen der Wartezeiten danach unterscheiden, ob die Passagiere einer Fluggesellschaft für das Check-In in nach Schalter getrennten Warteschlangen oder aber in einer einzigen grossen Warteschlange anstehen.

3. Chi-Quadrat-Test für die Varianz mit SPSS

Mit SPSS kann der Chi-Quadrat-Test für die Varianz nicht durchgeführt werden. Die Stichprobenvarianz kann mit SPSS berechnet werden.

4. SPSS-Befehle

Klicksequenz: Analysieren > Deskriptive Statistiken > Häufigkeiten

Varianz: Im Fenster „Statistiken“ > „Varianz” auswählen

Syntax:
FREQUENCIES VARIABLES
/STATISTICS=VARIANCE

5. Literatur

Field, A. (2009). Discovering Statistics Using SPSS. London: Sage.
Levine, D. M., Stephan, D., Krehbiel, T. C., & Berenson, M. L. (2008). Statistics for managers using Microsoft Excel. New Jersey: Pearson.

top