Minitab 22 - Regression - Darstellung der Anpassungslinie - Streckung und Stauchung der Konfidenzbänder
- Erstellt am 10.10.2023
- Überarbeitet am 9.4.2024
- Software: Minitab 22, 21, 20, 19
In diesem Artikel zeigen wir zwei Beispiele für Darstellungen der Anpassungslinie, deren Konfidenzbänder teilweise das folgende Verhalten aufzeigen:
- die Konfidenzbänder sind in der Mitte ist weiter auseinander als an einem der beiden Ränder
- die Konfidenzbänder sind an einem Rand weiter auseinander als am anderen Rand
Bilder
Erläuterung
Die beiden x-y-Datensätze sind aus Zufallszahlen.
Beim ersten Datensatz ist die x-Variable mehrgipflig verteilt, wobei ein Schwerpunkt auf der äußersten rechten Seite und ein weiterer, weniger starker auf der linken Seite liegt.
Beim zweiten Datensatz ist die x-Variable Weibull-verteilt, mit einer starken Neigung zur rechten Seite.
Die Beobachtungen scheinen darauf hinzudeuten, dass die Streckung/Stauchung des Konfidenzbandes um die linke Kurve von der Verdichtung der Daten und vom Grad des Polynoms abhängig zu sein scheint. Außerdem öffnet sich das Konfidenzband in jedem der beobachteten Fälle nach außen wieder, in unterschiedlicher Stärke.
Im linearen Fall scheint sich die engste Stelle des Konfidenzbandes nach dem Schwerpunkt der Daten zu orientieren. Das Konfidenzband scheint sich von diesem Schwerpunkt aus nach beiden Seiten hin gleichförmig zu öffnen.
Im quadratischen und kubischen Fall scheint sich besonders im ersten Datensatz die Mehrgipfligkeit der x-Variable auf den Verlauf der Breite des Konfidenzintervalls auszuwirken, das in den jeweiligen Verdichtungsstellen enger ausfällt als dort, wo die Daten dünner verteilt sind.
Bedeutung des Standardfehlers
Die Breite des Konfidenzintervalls an einer Stelle x0 ist abhängig vom Standardfehler des prognostizierten Mittelwerts in x0. Je kleiner der Standardfehler von x0 ist, desto kleiner ist die Breite des Konfidenzintervalls an dieser Stelle. Nach der Online-Hilfe von Minitab zum Werkzeug Regression: Prognose ist der prognostizierte Mittelwert der Antwortvariablen an der Stelle x0 genauer, je kleiner der Standardfehler ist. Man könnte also die geringere Breite der Konfidenzintervalle an den Stellen mit vielen Beobachtungen so interpretieren, dass der prognostizierte Mittelwert in einer Umgebung mit vielen vorhandenen Beobachtungen genauer prognostiziert wird als in einer Umgebung mit wenigen vorhandenen Beobachtungen.
Beispielsweise im Wahrscheinlichkeitsnetz sind aber die Konfidenzbänder an den Rändern weiter auseinander als in der Mitte?
Im Fall eines Wahrscheinlichkeitsnetzes sind die Prozentwerte der äquidistant, das heißt mit gleichbleibenden Abständen, auf der Prozent-Achse verteilt, und die Konfidenzbänder sind symmetrisch um die Daten-Werte. Man könnte diese als Konfidenzbänder einer Anpassungslinie in transponierter Form mit Daten-Werten als y- und Prozent-Werten als x-Variable auffassen. Aus der äquidistanten Verteilung der x-Werte würde dann entsprechend der vorherigen Überlegungen die Symmetrie des Konfidenzbandes um die y-Werte folgen.
Analog zur Regression spielt ist hier die Breite des Konfidenzbands an einer Stelle vom Standardfehler des Perzentils abhängig, und der Schätzwert für das Perzentil ist nach der Online-Hilfe von Minitab zum Werkzeug Qualitätswerkzeuge: Identifikation der Verteilung präziser bei einem kleineren Standardfehler.
Zur Berechnung der Konfidenzbänder in einem Wahrscheinlichkeitsnetz siehe auch:
Bedeutung der Konfidenzbänder in Wahrscheinlichkeitsnetzen
Anmerkung zur Äquidistanz der Prozentwerte auf der Prozent-Achse
Es gibt vier verschiedene Berechnungsmethoden für diese Prozentwerte in Wahrscheinlichkeitsnetzen: Die standardmäßige Methode Median-Rang (Benard) sowie alternativ die Methoden Mittlerer Rang (Herd-Johnson), Kaplan-Meier modifiziert (Hazen) und Kaplan Meier. Wenn die Datenwerte aufsteigend sortiert, unzensiert und ohne Duplikate sind, können die Abstände wie folgt berechnet werden:
-
Median-Rang: Der Abstand zwischen Beobachtung i und Beobachtung i+1 ist
und damit unabhängig von Rang i.
-
Mittlerer Rang: Der Abstand zwischen Beobachtung i und Beobachtung i+1 ist
und damit unabhängig von Rang i.
-
Kaplan-Meier modifiziert: Der Abstand zwischen Beobachtung i und Beobachtung i+1 ist
und damit unabhängig von Rang i.
-
Kaplan-Meier Produktlimitschätzung: Der Abstand zwischen Beobachtung i und Beobachtung i+1 ist
und damit unabhängig von Rang i.
Siehe hierzu in der Online-Hilfe des Werkzeugs Qualitätswerkzeuge: Identifikation der Verteilung zu den Diagrammpunkten.
|