Minitab 22 - Regression - Ein Beispiel, in dem der p-Wert der Regression kleiner ist als die p-Werte der Prädiktoren in der Tabelle der Varianzanalyse ist
- Erstellt am 28.6.2018
- Überarbeitet am 10.4.2024
- Software: Minitab 22, 21, 20, 19, 18
Für diesen Artikel haben wir ein Beispiel simuliert, in dem der p-Wert der Regression kleiner ist als der kleinste p-Wert der Prädiktorvariablen in der Tabelle der Varianzanalyse.
Varianzanalyse
Quelle |
DF |
Kor SS |
Kor MS |
F-Wert |
p-Wert |
Regression |
2 |
10,369 |
5,185 |
2,84 |
0,063 |
x1 |
1 |
5,949 |
5,949 |
3,26 |
0,074 |
x2 |
1 |
3,714 |
3,714 |
2,04 |
0,157 |
Fehler |
97 |
176,987 |
1,825 |
|
|
Gesamt |
99 |
187,356 |
|
|
|
In der Simulation haben wir die Antwortvariable als Summe aus normalverteilten Zufallszahlen und dem Produkt aus den beiden Prädiktoren erzeugt. Die Idee: Die Prädiktoren sollen einen Einfluss auf die Antwortvariable haben, allerdings in Form ihrer Wechselwirkung, nicht ihrer Haupteffekte.
Erläuterung
Der Datensatz, den wir für Sie auch im Downloadbereich dieses Artikels zur Verfügung stellen, hat einen Stichprobenumfang von 100. Die Antwortvariable ist y, die Prädiktoren sind x1 und x2, und wir haben diesen mit dem Werkzeug Statistik: Regression: Regression: Regressionsmodell anpassen angepasst. Dabei wird die Methode der kleinsten Quadrate angewendet. Angenommen, Sie haben die Anpassungen in einer Spalte Anpassungen gespeichert, und die Residuen, das sind die Differenzen aus Beobachtungen und Anpassungen, in einer weiteren Spalte Residuen. Den Wert Kor SS (Gesamt) erhalten Sie, wenn Sie im Methoden und Formeln für die Varianzanalyse in Regressionsmodell anpassen (Berechnen: Rechner) den Befehl
SSQ(y - Mean(y))
eingeben. SSQ ist dabei der Befehl, der die Summe der Quadrate bildet, und Mean ist der Befehl, der den Mittelwert eines Datensatzes berechnet. Das Teilen von Kor SS (Gesamt) durch die Anzahl der Freiheitsgrade DF Gesamt des Datensatzes würde die empirische Varianz der Spalte y ergeben. Den Wert Kor SS (Regression) erhalten Sie mit dem Rechner-Befehl
SSQ(Anpassungen - Mean(Anpassungen))
Analog würde sich durch das Teilen durch DF Gesamt die empirische Varianz der Spalte Anpassungen ergeben. Der Wert Den Wert Kor SS (Fehler) erhalten Sie mit dem Rechner-Befehl
SSQ(Residuen)
beziehungsweise
SSQ(y - Anpassungen)
Dieser Wert ist die Summe der Fehlerquadrate, die durch die Regressionsparameter minimiert worden ist. Es gilt außerdem
Allerdings ist
Um den Wert Kor SS (x1) zu berechnen, müssen Sie die Regression einmal ohne den Term x1 anpassen.
Varianzanalyse
Quelle |
DF |
Kor SS |
Kor MS |
F-Wert |
p-Wert |
Regression |
1 |
4,420 |
4,420 |
2,37 |
0,127 |
x2 |
1 |
4,420 |
4,420 |
2,37 |
0,127 |
Fehler |
98 |
182,936 |
1,867 |
|
|
Gesamt |
99 |
187,356 |
|
|
|
Wenn Sie den Wert Kor SS (Regression) aus der zweiten Tabelle (ohne den Term x1) vom Wert Kor SS (Regression) aus der ersten Tabelle (mit dem Term x1) abziehen, erhalten Sie den Wert Kor SS (x1) aus der ersten Tabelle. Analog können Sie den Wert Kor SS (x2) berechnen, indem Sie die Regression einmal ohne den Term x2 anpassen.
Varianzanalyse
Quelle |
DF |
Kor SS |
Kor MS |
F-Wert |
p-Wert |
Regression |
1 |
6,655 |
6,655 |
3,61 |
0,060 |
x1 |
1 |
6,655 |
6,655 |
3,61 |
0,060 |
Fehler |
98 |
180,701 |
1,844 |
|
|
Gesamt |
99 |
187,356 |
|
|
|
Zurück zur ersten Tabelle, ergeben sich jetzt die Kor MS Werte als Quotienten aus den jeweiligen Kor SS-Werten und den Anzahlen an Freiheitsgraden:
Die jeweiligen Teststatistiken, die F-Werte, mit denen auf Basis der F-Verteilung die p-Werte berechnet werden können, können Sie durch erneutes Teilen der Werte Kor MS (Regression), Kor MS (x1) und Kor MS (x2) durch den Wert Kor MS (Fehler) berechnen. Zur Berechnung der p-Werte könnten Sie dann das Werkzeug Berechnen: Wahrscheinlichkeitsverteilungen: F verwenden. Wir haben hier die F-Werte zusammen mit dem kritischen F-Wert, der dem p-Wert von 0,05 entspricht, grafisch mit dem Werkzeug Grafik: Darstellung der Wahrscheinlichkeitsverteilung: Wahrscheinlichkeit anzeigen mit der Option Eingefärbte Fläche definieren nach: Wahrscheinlichkeit am Rechten Randbereich dargestellt.
Die Regression selbst hat 2 Freiheitsgrade. Daher ist hier die Anzahl Freiheitsgrade für den Zähler gleich 2.
Die Terme haben jeweils 1 Freiheitsgrade, weswegen die Anzahl Freiheitsgrade für den Zähler hier 1 ist.
Die Anzahl Freiheitsgrade für den Nenner von 97 entspricht hier der Anzahl Freiheitsgrade DF Fehler.
Die Berechnungen haben wir in dem Projekt im Downloadbereich gemacht. Durch das Bewegen des Cursors auf den grünen Haken oberhalb der Ausgabespalte können Sie sich die Formel als Tooltip anzeigen lassen.
Siehe auch: Methoden und Formeln für die Varianzanalyse in Regressionsmodell anpassen
|