6078

Minitab 22 - Regression - Ein Beispiel, in dem der p-Wert der Regression kleiner ist als die p-Werte der Prädiktoren in der Tabelle der Varianzanalyse ist

  • Erstellt am 28.6.2018
  • Überarbeitet am 10.4.2024
  • Software: Minitab 22, 21, 20, 19, 18

Für diesen Artikel haben wir ein Beispiel simuliert, in dem der p-Wert der Regression kleiner ist als der kleinste p-Wert der Prädiktorvariablen in der Tabelle der Varianzanalyse.

Varianzanalyse

Quelle

DF

Kor SS

Kor MS

F-Wert

p-Wert

Regression

2

10,369

5,185

2,84

0,063

  x1

1

5,949

5,949

3,26

0,074

  x2

1

3,714

3,714

2,04

0,157

Fehler

97

176,987

1,825

 

 

Gesamt

99

187,356

 

 

 

In der Simulation haben wir die Antwortvariable als Summe aus normalverteilten Zufallszahlen und dem Produkt aus den beiden Prädiktoren erzeugt. Die Idee: Die Prädiktoren sollen einen Einfluss auf die Antwortvariable haben, allerdings in Form ihrer Wechselwirkung, nicht ihrer Haupteffekte.

Erläuterung

Der Datensatz, den wir für Sie auch im Downloadbereich dieses Artikels zur Verfügung stellen, hat einen Stichprobenumfang von 100. Die Antwortvariable ist y, die Prädiktoren sind x1 und x2, und wir haben diesen mit dem Werkzeug Statistik: Regression: Regression: Regressionsmodell anpassen angepasst. Dabei wird die Methode der kleinsten Quadrate angewendet. Angenommen, Sie haben die Anpassungen in einer Spalte Anpassungen gespeichert, und die Residuen, das sind die Differenzen aus Beobachtungen und Anpassungen, in einer weiteren Spalte Residuen. Den Wert Kor SS (Gesamt) erhalten Sie, wenn Sie im Methoden und Formeln für die Varianzanalyse in Regressionsmodell anpassen (Berechnen: Rechner) den Befehl

SSQ(y - Mean(y))

eingeben. SSQ ist dabei der Befehl, der die Summe der Quadrate bildet, und Mean ist der Befehl, der den Mittelwert eines Datensatzes berechnet. Das Teilen von Kor SS (Gesamt) durch die Anzahl der Freiheitsgrade DF Gesamt des Datensatzes würde die empirische Varianz der Spalte y ergeben. Den Wert Kor SS (Regression) erhalten Sie mit dem Rechner-Befehl

SSQ(Anpassungen - Mean(Anpassungen))

Analog würde sich durch das Teilen durch DF Gesamt die empirische Varianz der Spalte Anpassungen ergeben. Der Wert Den Wert Kor SS (Fehler) erhalten Sie mit dem Rechner-Befehl

SSQ(Residuen)

beziehungsweise

SSQ(y - Anpassungen)

Dieser Wert ist die Summe der Fehlerquadrate, die durch die Regressionsparameter minimiert worden ist. Es gilt außerdem

Kor SS (Regression)+Kor SS (Fehler)=Kor SS (Gesamt).

Allerdings ist

Kor SS x1+Kor SS x2Kor SS Regression

Um den Wert Kor SS (x1) zu berechnen, müssen Sie die Regression einmal ohne den Term x1 anpassen.

Varianzanalyse

Quelle

DF

Kor SS

Kor MS

F-Wert

p-Wert

Regression

1

4,420

4,420

2,37

0,127

  x2

1

4,420

4,420

2,37

0,127

Fehler

98

182,936

1,867

 

 

Gesamt

99

187,356

 

 

 

Wenn Sie den Wert Kor SS (Regression) aus der zweiten Tabelle (ohne den Term x1) vom Wert Kor SS (Regression) aus der ersten Tabelle (mit dem Term x1) abziehen, erhalten Sie den Wert Kor SS (x1) aus der ersten Tabelle. Analog können Sie den Wert Kor SS (x2) berechnen, indem Sie die Regression einmal ohne den Term x2 anpassen.

Varianzanalyse

Quelle

DF

Kor SS

Kor MS

F-Wert

p-Wert

Regression

1

6,655

6,655

3,61

0,060

  x1

1

6,655

6,655

3,61

0,060

Fehler

98

180,701

1,844

 

 

Gesamt

99

187,356

 

 

 

Zurück zur ersten Tabelle, ergeben sich jetzt die Kor MS Werte als Quotienten aus den jeweiligen Kor SS-Werten und den Anzahlen an Freiheitsgraden:

Kor MS (Regression)=Kor SS (Regression)DF (Regression)=Kor SS (Regression)2Kor MS (x1)=Kor SS (x1)DF (x1)=Kor SS (x1)Kor MS (x2)=Kor SS (x2)DF (x2)=Kor SS (x2)Kor MS (Fehler)=Kor SS (Fehler)DF (Fehler)=Kor SS (Fehler)97

Die jeweiligen Teststatistiken, die F-Werte, mit denen auf Basis der F-Verteilung die p-Werte berechnet werden können, können Sie durch erneutes Teilen der Werte Kor MS (Regression), Kor MS (x1) und Kor MS (x2) durch den Wert Kor MS (Fehler) berechnen. Zur Berechnung der p-Werte könnten Sie dann das Werkzeug Berechnen: Wahrscheinlichkeitsverteilungen: F verwenden. Wir haben hier die F-Werte zusammen mit dem kritischen F-Wert, der dem p-Wert von 0,05 entspricht, grafisch mit dem Werkzeug Grafik: Darstellung der Wahrscheinlichkeitsverteilung: Wahrscheinlichkeit anzeigen mit der Option Eingefärbte Fläche definieren nach: Wahrscheinlichkeit am Rechten Randbereich dargestellt.

Die Regression selbst hat 2 Freiheitsgrade. Daher ist hier die Anzahl Freiheitsgrade für den Zähler gleich 2.

p-Wert_regr_kleiner_als_p-Werte_praed_01

Die Terme haben jeweils 1 Freiheitsgrade, weswegen die Anzahl Freiheitsgrade für den Zähler hier 1 ist.

p-Wert_regr_kleiner_als_p-Werte_praed_02

Die Anzahl Freiheitsgrade für den Nenner von 97 entspricht hier der Anzahl Freiheitsgrade DF Fehler.

Die Berechnungen haben wir in dem Projekt im Downloadbereich gemacht. Durch das Bewegen des Cursors auf den grünen Haken oberhalb der Ausgabespalte können Sie sich die Formel als Tooltip anzeigen lassen.

Siehe auch: Methoden und Formeln für die Varianzanalyse in Regressionsmodell anpassen

Question?

Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein., wenn Sie eine Frage zu diesem Artikel haben.

Download