: Kategorie: Minitab FAQ Analysen

Minitab 22 - Binäre logistische Regression - Berechnung der Abweichungen

Erstellt am 25.05.2018
Überarbeitet am 10.4.2024
Software: Minitab 22, 21, 20, 19, 18

Wie werden bei der binären logistischen Regression die Abweichungen und darauf basierend die Abweichungsresiduen für die einzelnen Datenpunkte berechnet?

In diesem Artikel vollziehen wir die Berechnung dieser Werte am Beispiel für das Anpassen eines binären logistischen Regressionsmodells aus der Online-Hilfe von Minitab nach. Bei einer binären logistischen Regression wird eine Anpassungsgleichung für die Ereigniswahrscheinlichkeiten berechnet. Diese sieht in dem Fallbeispiel so aus:

Regressionsgleichung

p(1)

exp(Y')/(1 + exp(Y'))

Kinder	SpotGesehen
Ja	Ja	Y'	=	-0,5490 + 0,01374 Einkommen

Ja	Nein	Y'	=	-1,583 + 0,01374 Einkommen

Nein	Ja	Y'	=	-1,982 + 0,01374 Einkommen

Nein	Nein	Y'	=	-3,016 + 0,01374 Einkommen

Die angepassten Ereigniswahrscheinlichkeiten und für den späteren Vergleich die Abweichungsresiduen können Sie mit dem Unterdialog Binäre logistische Regression: Speichern in Spalten des Minitab-Arbeitsblatts speichern.

Die Loglikelihood-Anteile werden mit der Gleichung

$L n ({p_{i}}^{y_{i}} (1 - p_{i})^{1 - y_{i}})$

berechnet, wobei

y_i = 1 ist, wenn in Zeile i das Referenzereignis beobachtet wurde, und ansonsten 0 ist; und
p_i die durch das Modell prognostizierte Ereigniswahrscheinlichkeiten in Zeile i ist.

Der Beitrag d_i jeden Datenpunkts zur Abweichung entspricht dem jeweiligen Loglikelihood-Anteil, multipliziert mit dem Faktor -2:

$d_{i} = - 2 L n ({p_{i}}^{y_{i}} (1 - p_{i})^{1 - y_{i}})$

Wenn Sie die Spalte mit den angepassten Ereigniswahrscheinlichkeiten also p genannt haben, die Spalte der Antwortvariablen y und diese wie beschrieben mit 1 und 0 kodiert ist, können Sie eine neue Spalte d für die Abweichungsresiduen benennen und im Minitab-Rechner die Formel

-2*Ln(p^y*(1-p)^(1-y))

eingeben, um die Abweichungen (englisch: Deviances) in Spalte d zu berechnen.

Die Summe der Loglikelihood-Anteile Ln(p_i^y_i(1-p_i)^1-y_i) ist genau der Loglikelihood-Wert des Modells. Entsprechend erhalten Sie durch das Aufsummieren der Abweichungen d_i der einzelnen Beobachtungen genau den Chi-Quadrat-Wert der Abweichung in der Tabelle der Tests auf Güte der Anpassung, der das (-2)-fache des Loglikelihood-Wertes des Modells ist.

Tests auf Güte der Anpassung

Test	DF	Chi-Quadrat	p-Wert
Abweichung	67	76,77	0,194
Pearson	67	76,11	0,209
Hosmer-Lemeshow	8	5,58	0,694

Die Abweichungsresiduen wiederrum erhalten Sie daraus aus der Formel

$sgn (y_{i} - p_{i}) \sqrt{d_{i}}$

Wenn Sie die Spalte mit den angepassten Ereigniswahrscheinlichkeiten p, die Spalte der Antwortvariablen y und die Spalte mit den Abweichungen d genannt haben, können Sie zur Berechnung der Abweichungsresiduen mit dem Minitab-Rechner die Formel

Sign(y - p)*Sqrt(d)

eingeben.

Siehe hierzu auch:

Methoden und Formeln - Binäres logistisches Modell anpassen - Statistiken für die Güte der Anpassung - Abweichung

Methoden und Formeln - Binäres logistisches Modell anpassen - Bewertungsmaße - AbweichungsresiduenBinäres logistisches Modell anpassen - Bewertungsmaße - Abweichungsresiduen

In der Tabelle der Tests auf Güte der Anpassung bekomme ich eine Abweichung von 0. Was ist eine mögliche Ursache hierfür?

Die Abweichung ist dann von 0 verschieden, wenn der Likelihood-Wert von 1 verschieden bzw. der Loglikelihood-Wert von 0 verschieden ist, was dann der Fall ist, wenn der Wert R-Qd der Abweichung, also der Anteil der Gesamtabweichung der Antwortvariablen, der vom Modell erklärt wird, gleich 100% ist.

Siehe hierzu auch:

Methoden und Formeln für die Zusammenfassung des Modells in Binäres logistisches Modell anpassen - R² der Abweichung

Tabelle mit der Zusammenfassung des Modells für Binäres logistisches Modell anpassen - R² der Abweichung