Minitab 22 - Berechnung von Varianzinflationsfaktoren (VIF)
- Überarbeitet am 29.4.2024
- Software: Minitab 22, 21, 20, 19, 18, 17
Was sind Varianzinflationsfaktoren, und welche Bedeutung haben sie in den Werkzeugen zur Versuchsplanung, Regression und ANOVA?
Das entsprechende APS-Paket ist über unseren ADDITIVE Professional Service erhältlich. Um das Paket zu erhalten, kontaktieren Sie unseren Support per E-Mail an
Erläuterung
In der Regression bezieht sich die Multikollinearität auf Prädiktoren, die mit anderen Prädiktoren korreliert sind.
Eine mäßige Multikollinearität stellt nicht unbedingt ein Problem dar. Eine große Multikollinearität ist jedoch problematisch, da dies zu einer erhöhten Varianz der Regressionskoeffizienten führen kann. Diese sind dann instabil und schwierig zu interpretieren.
Die Varianzinflationsfaktoren analysieren den Versuchsaufbau und betreffen nicht die Antwortvariable. Varianzinflationsfaktoren dienen dazu, eine Korrelation zwischen den Prädiktoren festzustellen. Sollte es eine Korrelation unter den Prädiktoren geben, können die Koeffizienten der Prädiktoren nur ungenau geschätzt werden.
Berechnet werden Varianzinflationsfaktoren iterativ über die Parameterkovarianzen der Fisher-Information der X-Faktoren der Designmatrix.
Als grobe Richtwerte (Faustregel) zum Bewerten der Korrelation zwischen den Prädiktoren gelten:
VIF = 1 | ⇒ | Nicht korreliert | |
VIF < 5 | ⇒ | Mäßig korreliert | |
VIF > 5 bis 10 | ⇒ | Starke Korrelation |
Naturgemäß sind die meisten Versuchspläne orthogonal, das heißt, Varianzinflationsfaktoren haben Werte in der Nähe von 1.
Varianzinflationsfaktoren sind dann sinnvoll, wenn beispielsweise ein D-optimaler oder Screening-Versuchsplan aufgesetzt wurde, oder auch wenn ein Versuchsplan händisch manipuliert wurde (Entfernen von Versuchspunkten, die nicht angefahren werden konnten.)
Beispiel an Hand eines zentral zusammengesetzten Versuchsplans
Tabelle der Daten in nicht kodierten Einheiten
↓ | C1 | C2 | C3 | C4 | C5 | C6 | C7 |
StdRfolge | Durchlaufreihenfolge | Blöcke | Punkttyp | A | B | y | |
1 | 3 | 1 | 1 | 0 | 200.000 | 600.000 | -1,45063 |
2 | 9 | 2 | 1 | 1 | 250.000 | 550.000 | 0.86699 |
3 | 4 | 3 | 1 | 0 | 300.000 | 600.000 | 0.21388 |
4 | 1 | 4 | 1 | 1 | 200.000 | 500.000 | -1.57752 |
5 | 2 | 5 | 1 | -1 | 300.000 | 500.000 | 0.94910 |
6 | 10 | 6 | 1 | 1 | 250.000 | 550.000 | 0.93044 |
7 | 11 | 7 | 1 | 1 | 250.000 | 550.000 | 0.60948 |
8 | 7 | 8 | 1 | 0 | 250.000 | 479.289 | -0.37952 |
9 | 12 | 9 | 1 | -1 | 250.000 | 550.000 | 1.18795 |
10 | 6 | 10 | 1 | 0 | 320.711 | 550.000 | 0.18029 |
11 | 5 | 11 | 1 | -1 | 179.289 | 550.000 | -1.37972 |
12 | 8 | 12 | 1 | 0 | 250.000 | 620.711 | -0.77139 |
13 | 13 | 13 | 1 | -1 | 250.000 | 550.000 | 0.62067 |
Tabelle der Daten in kodierten Einheiten
↓ | C1 | C2 | C3 | C4 | C5 | C6 | C7 |
StdRfolge | Durchlaufreihenfolge | Blöcke | Punkttyp | A | B | y | |
1 | 3 | 1 | 1 | 0 | -1.00000 | 1.00000 | -1.45063 |
2 | 9 | 2 | 1 | 1 | 0.00000 | 0.00000 | 0.86699 |
3 | 4 | 3 | 1 | 0 | 1.00000 | 1.00000 | 0.21388 |
4 | 1 | 4 | 1 | 1 | -1.00000 | -1.00000 | -1.5775 |
5 | 2 | 5 | 1 | -1 | 1.00000 | -1.00000 | 0.94910 |
6 | 10 | 6 | 1 | 1 | 0.00000 | 0.00000 | 0.93044 |
7 | 11 | 7 | 1 | 1 | 0.00000 | 0.00000 | 0.60948 |
8 | 7 | 8 | 1 | 0 | 0.00000 | -1.41421 | -0.37952 |
9 | 12 | 9 | 1 | -1 | 0.00000 | 0.00000 | 1.18795 |
10 | 6 | 10 | 1 | 0 | 1.41421 | 0.00000 | 0.18029 |
11 | 5 | 11 | 1 | -1 | -1.41421 | 0.00000 | -1.37972 |
12 | 8 | 12 | 1 | 0 | 0.00000 | 1.41421 | -0.77139 |
13 | 13 | 13 | 1 | -1 | 0.00000 | 0.00000 | 0.62067 |
Analyse in nicht kodierten Einheiten (Statistik: Regression: Regression: Regressionsmodell anpassen)
ADD_SUP_MINITAB_VIF_CCD.MTW
Regressionsanalyse: y vs. A; B
Regressionsgleichung
y | = | -14,3 + 0,0634 A + 0,0186 B - 0,000086 A*B |
---|
Koeffizienten
Term | Koef | SE Koef | t-Wert | p-Wert | VIF |
---|---|---|---|---|---|
Konstante | -14,3 | 23,7 | -0,60 | 0,562 | |
A | 0,0634 | 0,0939 | 0,68 | 0,516 | 243,00 |
B | 0,0186 | 0,0430 | 0,43 | 0,675 | 51,00 |
A*B | -0,000086 | 0,000170 | -0,51 | 0,625 | 293,00 |
Zusammenfassung des Modells
S | R-Qd | R-Qd(kor) | R-Qd(prog) |
---|---|---|---|
0,851766 | 45,59% | 27,45% | 0,00% |
Varianzanalyse
Quelle | DF | Kor SS | Kor MS | F-Wert | p-Wert |
---|---|---|---|---|---|
Regression | 3 | 5,4705 | 1,82349 | 2,51 | 0,124 |
A | 1 | 0,3309 | 0,33093 | 0,46 | 0,516 |
B | 1 | 0,1363 | 0,13635 | 0,19 | 0,675 |
A*B | 1 | 0,1858 | 0,18581 | 0,26 | 0,625 |
Fehler | 9 | 6,5295 | 0,72550 | ||
Fehlende Anpassung | 5 | 6,2984 | 1,25967 | 21,80 | 0,005 |
Reiner Fehler | 4 | 0,2312 | 0,05779 | ||
Gesamt | 12 | 12,0000 |
Analyse in kodierten Einheiten (Statistik: Versuchsplanung (DOE): Wirkungsfläche: Wirkungsflächenversuchsplan analysieren)
ADD_SUP_MINITAB_VIF_CCD.MTW
Regression für Wirkungsfläche: y vs. A; B
Kodierte Koeffizienten
Term | Koef | SE Koef | t-Wert | p-Wert | VIF |
---|---|---|---|---|---|
Konstante | -0,000 | 0,236 | -0,00 | 1,000 | |
A | 0,800 | 0,301 | 2,66 | 0,026 | 1,00 |
B | -0,145 | 0,301 | -0,48 | 0,641 | 1,00 |
A*B | -0,216 | 0,426 | -0,51 | 0,625 | 1,00 |
Zusammenfassung des Modells
S | R-Qd | R-Qd(kor) | R-Qd(prog) |
---|---|---|---|
0,851766 | 45,59% | 27,45% | 0,00% |
Varianzanalyse
Quelle | DF | Kor SS | Kor MS | F-Wert | p-Wert |
---|---|---|---|---|---|
Modell | 3 | 5,4705 | 1,82349 | 2,51 | 0,124 |
Linear | 2 | 5,2846 | 2,64232 | 3,64 | 0,069 |
A | 1 | 5,1157 | 5,11572 | 7,05 | 0,026 |
B | 1 | 0,1689 | 0,16893 | 0,23 | 0,641 |
2-Faktor-Wechselwirkung | 1 | 0,1858 | 0,18581 | 0,26 | 0,625 |
A*B | 1 | 0,1858 | 0,18581 | 0,26 | 0,625 |
Fehler | 9 | 6,5295 | 0,72550 | ||
Fehlende Anpassung | 5 | 6,2984 | 1,25967 | 21,80 | 0,005 |
Reiner Fehler | 4 | 0,2312 | 0,05779 | ||
Gesamt | 12 | 12,0000 |
Regressionsgleichung in nicht kodierten Einheiten
y | = | -14,3 + 0,0634 A + 0,0186 B - 0,000086 A*B |
---|
Das APS-Paket Nr. 352 enthält ein Minitab-Arbeitsblatt mit den Spalten des Versuchsplans aus dem Beispiel, sowie ein Bildschirmvideo im MP4-Format, in welchem diese beiden Analysen, einmal in kodierten Einheiten als Wirkungsflächenversuchsplananalyse und einmal in nicht kodierten Einheiten als Regression, durchgeführt werden.
Das APS-Paket Nr. 898 enthält ein Minitab-Arbeitsblatt sowie ein Word-Dokument mit den Ergebnissen einer Beispielregression aus dem Menü Statistik: Regression: Regression: Regressionsmodell anpassen, für welche wir die Berechnung der Varianzinflationsfaktoren manuell nachvollzogen haben. Die Formel über der Spalte VIF können Sie einsehen, indem Sie einen Doppelklick auf den grünen Haken oberhalb dieser Spalte machen.
Siehe auch
Berechnung der Bedingungszahl mit Minitab
Kodierte und nicht kodierte Einheiten
|