Minitab 22 - Binäre logistische Regression - Berechnung der Abweichungen
- Erstellt am 25.05.2018
- Überarbeitet am 10.4.2024
- Software: Minitab 22, 21, 20, 19, 18
Wie werden bei der binären logistischen Regression die Abweichungen und darauf basierend die Abweichungsresiduen für die einzelnen Datenpunkte berechnet?
In diesem Artikel vollziehen wir die Berechnung dieser Werte am Beispiel für das Anpassen eines binären logistischen Regressionsmodells aus der Online-Hilfe von Minitab nach. Bei einer binären logistischen Regression wird eine Anpassungsgleichung für die Ereigniswahrscheinlichkeiten berechnet. Diese sieht in dem Fallbeispiel so aus:
Regressionsgleichung
p(1) |
= |
exp(Y')/(1 + exp(Y')) |
Kinder |
SpotGesehen |
|||
Ja |
Ja |
Y' |
= |
-0,5490 + 0,01374 Einkommen |
|
|
|
|
|
Ja |
Nein |
Y' |
= |
-1,583 + 0,01374 Einkommen |
|
|
|
|
|
Nein |
Ja |
Y' |
= |
-1,982 + 0,01374 Einkommen |
|
|
|
|
|
Nein |
Nein |
Y' |
= |
-3,016 + 0,01374 Einkommen |
Die angepassten Ereigniswahrscheinlichkeiten und für den späteren Vergleich die Abweichungsresiduen können Sie mit dem Unterdialog Binäre logistische Regression: Speichern in Spalten des Minitab-Arbeitsblatts speichern.
Die Loglikelihood-Anteile werden mit der Gleichung
berechnet, wobei
- yi = 1 ist, wenn in Zeile i das Referenzereignis beobachtet wurde, und ansonsten 0 ist; und
- pi die durch das Modell prognostizierte Ereigniswahrscheinlichkeiten in Zeile i ist.
Der Beitrag di jeden Datenpunkts zur Abweichung entspricht dem jeweiligen Loglikelihood-Anteil, multipliziert mit dem Faktor -2:
Wenn Sie die Spalte mit den angepassten Ereigniswahrscheinlichkeiten also p genannt haben, die Spalte der Antwortvariablen y und diese wie beschrieben mit 1 und 0 kodiert ist, können Sie eine neue Spalte d für die Abweichungsresiduen benennen und im Minitab-Rechner die Formel
-2*Ln(p^y*(1-p)^(1-y))
eingeben, um die Abweichungen (englisch: Deviances) in Spalte d zu berechnen.
Die Summe der Loglikelihood-Anteile Ln(piyi(1-pi)1-yi) ist genau der Loglikelihood-Wert des Modells. Entsprechend erhalten Sie durch das Aufsummieren der Abweichungen di der einzelnen Beobachtungen genau den Chi-Quadrat-Wert der Abweichung in der Tabelle der Tests auf Güte der Anpassung, der das (-2)-fache des Loglikelihood-Wertes des Modells ist.
Tests auf Güte der Anpassung
Test |
DF |
Chi-Quadrat |
p-Wert |
Abweichung |
67 |
76,77 |
0,194 |
Pearson |
67 |
76,11 |
0,209 |
Hosmer-Lemeshow |
8 |
5,58 |
0,694 |
Die Abweichungsresiduen wiederrum erhalten Sie daraus aus der Formel
Wenn Sie die Spalte mit den angepassten Ereigniswahrscheinlichkeiten p, die Spalte der Antwortvariablen y und die Spalte mit den Abweichungen d genannt haben, können Sie zur Berechnung der Abweichungsresiduen mit dem Minitab-Rechner die Formel
Sign(y - p)*Sqrt(d)
eingeben.
Siehe hierzu auch:
In der Tabelle der Tests auf Güte der Anpassung bekomme ich eine Abweichung von 0. Was ist eine mögliche Ursache hierfür?
Die Abweichung ist dann von 0 verschieden, wenn der Likelihood-Wert von 1 verschieden bzw. der Loglikelihood-Wert von 0 verschieden ist, was dann der Fall ist, wenn der Wert R-Qd der Abweichung, also der Anteil der Gesamtabweichung der Antwortvariablen, der vom Modell erklärt wird, gleich 100% ist.
Siehe hierzu auch:
|