Minitab 22 – Einfache ANOVA – Faktor signifikant, aber keine signifikante Mittelwertdifferenz nach Tukey
- Erstellt am 9.11.2021
- Überarbeitet am 9.4.2024
- Software: Minitab 22, 21
In meiner Einfachen ANOVA hat der Faktor einen p-Wert < 0,05. Somit würde die Nullhypothese zu Gunsten der Alternativhypothese Nicht alle Mittelwerte sind gleich verworfen. Der Tukey-Test zeigt aber keine einzige von 0 signifikante Mittelwertdifferenz an. Wie kann das sein?
ARBEITSBLATT 1
Einfache ANOVA: Daten vs. Faktor
Methode
Nullhypothese |
Alle Mittelwerte sind gleich. |
Alternativhypothese |
Nicht alle Mittelwerte sind gleich. |
Signifikanzniveau |
α = 0,05 |
Für die Analyse wurde von gleichen Varianzen ausgegangen.
Faktorinformationen
Faktor |
Stufen |
Werte |
Faktor |
4 |
A; B; C; D |
Varianzanalyse
Quelle |
DF |
Kor SS |
Kor MS |
F-Wert |
p-Wert |
Faktor |
3 |
7,764 |
2,5881 |
3,33 |
0,024 |
Fehler |
76 |
58,997 |
0,7763 |
|
|
Gesamt |
79 |
66,761 |
|
|
|
Zusammenfassung des Modells
S |
R-Qd |
R-Qd(kor) |
R-Qd(prog) |
0,881062 |
11,63% |
8,14% |
2,08% |
Mittelwerte
Faktor |
N |
Mittelwert |
StdAbw |
95%-KI |
A |
20 |
10,623 |
0,733 |
(10,231; 11,016) |
B |
20 |
10,000 |
0,949 |
(9,607; 10,392) |
C |
20 |
10,626 |
0,939 |
(10,234; 11,019) |
D |
20 |
10,004 |
0,886 |
(9,612; 10,397) |
Zusammengefasste StdAbw = 0,881062
Paarweise Vergleiche nach Tukey
Gruppierungsinformationen anhand der Tukey-Methode und 95%-Konfidenz
Faktor |
N |
Mittelwert |
Gruppierung |
C |
20 |
10,626 |
A |
A |
20 |
10,623 |
A |
D |
20 |
10,004 |
A |
B |
20 |
10,000 |
A |
Mittelwerte, die keinen gemeinsamen Gruppierungsbuchstaben haben, unterscheiden sich
signifikant.
Erläuterung
In diesem Artikel setzen wir uns mit dem Fall auseinander, dass der Faktor der Einfachen ANOVA einen p-Wert unterhalb des Signifikanzniveaus α (in diesem Beispiel ist α = 0,05) hat, während sich beim Tukey-Test keine einzige der paarweisen Mittelwertdifferenzen als von 0 signifikant verschieden herausstellt. Hintergrund ist die Nullhypothese Alle Mittelwerte sind gleich der Einfachen ANOVA. Es sind genau dann alle Mittelwerte gleich, wenn jedes Paar aus diesen Mittelwerten untereinander gleich ist, also wenn alle Mittelwertdifferenzen gleich 0 sind. Wenn nicht alle Mittelwerte gleich sind, dann ist mindestens eine der Mittelwertdifferenzen ungleich 0.
Wir haben jetzt die Situation, dass die Nullhypothese Alle Mittelwerte sind gleich verworfen wird, man könnte sagen, aller Wahrscheinlichkeit nach gibt es mindestens zwei ungleiche Mittelwerte, also mindestens eine von 0 verschiedene Mittelwertdifferenz. Gleichzeitig wird aber beim paarweisen Vergleich nach Tukey keine der paarweisen Nullhypothesen Die Mittelwertdifferenz ist gleich 0 verworfen. Also ist kein einziges Paar aus diesen Mittelwerten untereinander signifikant verschieden. Um die Möglichkeit des Auftretens dieser Situation besser zu verstehen, beginnen wir mit einem Exkurs.
Exkurs: Wahrheitswert versus Wahrscheinlichkeit
Da beim statistischen Test mit Wahrscheinlichkeiten gearbeitet wird, sollte man bei der Interpretation immer im Auge behalten, dass hier keine 100%- ige Aussage zum Wahrheitswert der Nullhypothese, wahr oder falsch, gemacht werden kann, sondern nur darüber, ob die Wahrscheinlichkeit gegen die Nullhypothese bei der vorliegenden Datenlage gering genug ist, um die Nullhypothese nicht zu verwerfen.
Wenn A und B zwei Aussagen sind, denen ein eindeutiger Wahrheitswert zugewiesen werden kann, dann gilt für die Aussage A und B
A |
B |
A oder B |
Wahr |
Wahr |
Wahr |
Wahr |
Falsch |
Falsch |
Falsch |
Wahr |
Falsch |
Falsch |
Falsch |
Falsch |
Das bedeutet, wenn die Aussage A und B falsch ist, ist entweder die Aussage A oder die Aussage B falsch. Bei sechs Aussagen wäre die A und B und C und D und E und F genau dann falsch, wenn entweder die Aussage A, die Aussage B, die Aussage C, die Aussage D, die Aussage E oder die Aussage F falsch ist, wobei das oder hier nicht exklusiv ist.
Anders verhält es sich, wenn der Hypothese A und B und C und D und E und F statt einem Wahrheitswert nur ein Wahrscheinlichkeitswert zwischen 0 und 1 zugeordnet wird. Nehmen wir als Beispiel eine Liste aus Punkten (w;x;y;z) mit den folgenden Werten als Grundgesamtheit:
w |
x |
y |
z |
1 |
1 |
1 |
2 |
1 |
1 |
1 |
3 |
1 |
1 |
2 |
1 |
1 |
1 |
3 |
1 |
1 |
2 |
1 |
1 |
1 |
2 |
2 |
2 |
1 |
3 |
1 |
1 |
1 |
3 |
3 |
3 |
2 |
1 |
1 |
1 |
2 |
1 |
2 |
2 |
2 |
2 |
1 |
2 |
2 |
2 |
2 |
1 |
2 |
2 |
2 |
3 |
2 |
2 |
3 |
2 |
2 |
3 |
2 |
2 |
2 |
3 |
3 |
3 |
3 |
1 |
1 |
1 |
3 |
1 |
3 |
3 |
3 |
2 |
2 |
2 |
3 |
2 |
3 |
3 |
3 |
3 |
1 |
3 |
3 |
3 |
2 |
3 |
3 |
3 |
3 |
1 |
3 |
3 |
3 |
2 |
und das Ereignis
A: w = x
B: w = y
C: w = z
D: x = y
E: x = z
F: y = z
und damit
A und B und C und D und E und F: w = x = y = z
Die Wahrscheinlichkeit für A und B und C und D und E und F ist gleich 0, weil die Grundgesamtheit nicht einen Punkt enthält, auf den sie zutrifft. Allerdings sind die Wahrscheinlichkeiten für jedes der Ereignisse A, B, C, D, E und F jeweils gleich 0,5.
Eine Metapher: Ein Gerichtsprozess mit sechs Angeklagten
Wir verwenden gerne die Metapher eines Gerichtsprozesses. Die sechs Mittelwertdifferenzen Gruppenwerte in diesem ANOVA-Beispiel entsprechen sechs Angeklagten, und wir haben genug Indizien dafür gesammelt, dass mindestens einer der Angeklagten schuldig sein muss, aber für jeden der sechs Angeklagten jeweils nicht genug Indizien für die Schuld eines individuellen Angeklagten, sodass bei der vorliegenden Datenlage (und dem gewählten Signifikanzniveau) alle sechs freigesprochen werden müssten.
Angenommen, wir legen ein Signifikanzniveau von α = 0,05 für die Einfache ANOVA und für den Tukey-Test fest. Die Nullhypothesen für den Tukey-Test sind:
B-A: Die Differenz des Mittelwerts der Gruppe B und des Mittelwerts der Gruppe A ist gleich 0, oder kurz xB – xA = 0.
C-A: xC – xA = 0
D-A: xD – xA = 0
C-B: xC – xB = 0
D-B: xD – xB = 0
D-C: xD – xC = 0
Die Alternativhypothesen sind
Nicht B-A: xB – xA ≠ 0.
Nicht C-A: xC – xA ≠ 0
Nicht D-A: xD – xA ≠ 0
Nicht C-B: xC – xB ≠ 0
Nicht D-B: xD – xB ≠ 0
Nicht D-C: xD – xC ≠ 0
Die Nullhypothese für die Einfache ANOVA ist
Alle Mittelwerte sind gleich.
Mit den Nullhypothesen des Tukey-Tests könnten wir diese umformulieren in
B-A und C-A und D-A und C-B und D-B und D-C xB – xA = 0 und xC – xA = 0 und xD – xA = 0 und xC – xB = 0 und xD – xB = 0 und xD – xC = 0
Die Alternativhypothese ließe sich dann formulieren als
(Nicht B-A) oder (Nicht C-A) oder (Nicht D-A) oder (Nicht C-B) oder (Nicht D-B) oder (Nicht D-C): xB – xA ≠ 0 oder xC – xA ≠ 0 oder xD – xA ≠ 0 oder xC – xB ≠ 0 oder xD – xB ≠ 0 oder xD – xC ≠ 0
Der p-Wert in der Tabelle Varianzanalyse ist 0,024 < 0,05, also wird die Nullhypothese B-A und C-A und D-A und C-B und D-B und D-C zu Gunsten der Alternativhypothese (Nicht B-A) oder (Nicht C-A) oder (Nicht D-A) oder (Nicht C-B) oder (Nicht D-B) oder (Nicht D-C) verworfen. Man könnte darum sagen, wir bekommen aus der Stichprobe genügend Hinweise darauf, dass mindestens eine der Mittelwertdifferenzen in der Grundgesamtheit von 0 verschieden ist.
Für die Einzelhypothesen beim Tukey-Test gilt:
- Das Intervall B-A enthält den Wert 0. Also kann die Nullhypothese B-A nicht zu Gunsten der Alternativhypothese Nicht B-A verworfen werden. Man könnte darum sagen, wir bekommen aus der Stichprobe nicht genügend Hinweise darauf, dass die Mittelwertdifferenz xB – xA in der Grundgesamtheit von 0 verschieden ist.
- Das Intervall C-A enthält den Wert 0. Also kann die Nullhypothese C-A nicht zu Gunsten der Alternativhypothese Nicht C-A verworfen werden. Man könnte darum sagen, wir bekommen aus der Stichprobe nicht genügend Hinweise darauf, dass die Mittelwertdifferenz xC – xA in der Grundgesamtheit von 0 verschieden ist.
- Das Intervall D-A enthält den Wert 0. Also kann die Nullhypothese D-A nicht zu Gunsten der Alternativhypothese Nicht D-A verworfen werden. Man könnte darum sagen, wir bekommen aus der Stichprobe nicht genügend Hinweise darauf, dass die Mittelwertdifferenz xD – xA in der Grundgesamtheit von 0 verschieden ist.
- Das Intervall C-B enthält den Wert 0. Also kann die Nullhypothese C-B nicht zu Gunsten der Alternativhypothese Nicht C-B verworfen werden. Man könnte darum sagen, wir bekommen aus der Stichprobe nicht genügend Hinweise darauf, dass die Mittelwertdifferenz xC – xB in der Grundgesamtheit von 0 verschieden ist.
- Das Intervall D-B enthält den Wert 0. Also kann die Nullhypothese D-B nicht zu Gunsten der Alternativhypothese Nicht D-B verworfen werden. Man könnte darum sagen, wir bekommen aus der Stichprobe nicht genügend Hinweise darauf, dass die Mittelwertdifferenz xD – xB in der Grundgesamtheit von 0 verschieden ist.
- Das Intervall D-C enthält den Wert 0. Also kann die Nullhypothese D-C nicht zu Gunsten der Alternativhypothese Nicht D-C verworfen werden. Man könnte darum sagen, wir bekommen aus der Stichprobe nicht genügend Hinweise darauf, dass die Mittelwertdifferenz xD – xC in der Grundgesamtheit von 0 verschieden ist.
|