Minitab 22 - Beispiel für ein Simulationsmakro: Zufallszahlen mit Verteilung X, Anderson-Darling-Test mit Verteilung Y
- Erstellt am 17.5.2022
- Überarbeitet am 16.5.2024
- Software: Minitab 22, 21
Der folgende Datensatz stammt aus einer Grundgesamtheit mit der Kleinster-Extremwert-Verteilung.
↓ | C1 |
1 | 9,817033220725554 |
2 | 9,923132541025424 |
3 | 9,816320621483278 |
4 | 10,019013708858033 |
5 | 10,044332690184957 |
6 | 9,931381279064357 |
7 | 10,037108379340605 |
8 | 9,994075359764125 |
9 | 9,894572197918626 |
10 | 9,956763624437192 |
11 | 9,984305750118823 |
12 | 9,918934289347751 |
13 | 10,056290948086287 |
14 | 9,966368598355086 |
15 | 9,945258709208247 |
16 | 9,863105305151091 |
17 | 10,036597570769512 |
18 | 10,003020877940658 |
19 | 9,974694216395703 |
20 | 10,026467700180721 |
21 | 9,868618131246048 |
22 | 9,976699185740644 |
23 | 9,904347537979556 |
24 | 9,867271911169157 |
25 | 10,006565583166083 |
26 | 9,891993049423313 |
27 | 9,956101241918081 |
28 | 10,006793457212012 |
29 | 9,798087075945118 |
30 | 9,967283500949232 |
31 | 9,935655864558287 |
32 | 9,986708313108775 |
33 | 10,013251464530653 |
34 | 9,904664556126297 |
35 | 9,973980786947710 |
36 | 9,972654694220742 |
37 | 9,985084795176142 |
38 | 9,973708179194722 |
39 | 9,952433143332607 |
40 | 9,897206885128393 |
41 | 10,006854554639526 |
42 | 10,060054621089160 |
43 | 9,979125212165231 |
44 | 9,922561165427085 |
45 | 9,946462541112245 |
46 | 10,022134738585954 |
47 | 9,902966081307062 |
48 | 9,976393408237954 |
49 | 10,054876460043216 |
50 | 9,852161704479540 |
51 | 10,030133463296405 |
52 | 9,952616407648817 |
53 | 10,006121815093874 |
54 | 10,015546390998182 |
55 | 9,922715023322263 |
56 | 9,994220989600384 |
57 | 9,925014240294985 |
58 | 9,891642751013180 |
59 | 9,899513928308359 |
60 | 9,930385743915767 |
61 | 9,994401538097652 |
62 | 10,051571136664508 |
63 | 9,990944924003484 |
64 | 9,880400871014691 |
65 | 9,946654887415871 |
66 | 9,977491075951859 |
67 | 9,930984931556891 |
68 | 9,964629547244108 |
69 | 9,933768674188284 |
70 | 10,015917119689412 |
71 | 10,005489833701267 |
72 | 9,869987659831772 |
73 | 10,027799878008512 |
74 | 9,995247994977163 |
75 | 9,904646773349752 |
76 | 9,969519825625227 |
77 | 9,980047560061005 |
78 | 9,956458821563039 |
79 | 9,966710464187512 |
80 | 9,967420735803520 |
Jedoch weicht seine Verteilung auch nicht statistisch signifikant von der Normalverteilung ab:
Wahrscheinlichkeitsnetz mit Kleinster-Extremwert-Verteilung | Wahrscheinlichkeitsnetz mit Normalverteilung |
Wenn ich Spezifikationsgrenzen von 9,5 und 10,5 habe und mit Hilfe von Toleranzintervallen überprüfen will, ob dass 95%-Toleranzintervall, das mindestens 99,9937% Grundgesamtheit abdeckt, noch innerhalb dieser Grenzen liegt, ist dies für die Kleinster-Extremwert-Verteilung nicht der Fall, für die Normalverteilung jedoch schon.
Für Stichprobenumfänge von 80, 100 und 120 will ich deshalb simulieren, wie häufig für Datensätze aus der Kleinster-Extremwert-Verteilung mit Lageparameter 10 und Skalenparameter 0,05 die Nullhypothese
H0: Der Datensatz ist normalverteilt.
des Anderson-Darling-Tests auf Normalverteilung fälschlicherweise nicht verworfen würde. Gibt es ein Makro, mit dem ich das tun kann?
Das entsprechende APS-Paket ist über unseren ADDITIVE Professional Service erhältlich. Um das Paket zu erhalten, kontaktieren Sie unseren Support per E-Mail an
Erläuterung
Das APS-Paket Nr. 1049 besteht aus dem lokalen Makro ADD_sup_Simulationen_Zufallszahlen_versus_AD_Test.mac. Dieses Makro erstellt für
- eine oder mehrere vorgegebene Verteilungen, einschließlich der vorgegebenen Verteilungsparameter, sowie
- einen oder mehrere vorgegebene Stichprobenumfänge
entsprechend einer vorgegebenen Anzahl an simulierten Datensätzen mit den vorgegebenen Stichprobenumfängen Zufallszahlen und führt an jeder einzelnen Simulation einen Anderson-Darling-Test an einer Verteilung durch, die Sie ebenfalls vorgeben.
Bitte legen Sie das Makro in dem Verzeichnis ab, dass Sie in Minitab unter Datei: Optionen als Speicherort für Makros festgelegt haben. Stellen Sie sicher, dass das Verzeichnis C:\Temp auf Ihrem Rechner existiert.
Angenommen,
-
die Verteilungsformen für die Zufallszahlen sind in Spalte C1 hinterlegt (im einleitenden Beispiel ist dies die Kleinster-Extremwert-Verteilung),
-
die Verteilung für den Anderson-Darling-Test ist die Normalverteilung,
-
die ersten Parameter sind in Spalte C2 hinterlegt (im Beispiel der Lageparameter 10),
-
die zweiten Parameter sind in Spalte C3 hinterlegt (im Beispiel der Skalenparameter 0,05),
-
die Stichprobenumfänge sind in Spalte C4 hinterlegt,
↓ C1 C2 C3 C4 Verteilung Parameter 1 Parameter 2 Stichprobenumfang 1 Kleinster Extremwert 10 0,05 80 2 Kleinster Extremwert 10 0,05 100 3 Kleinster Extremwert 10 0,05 120 -
für jede Zeile sollen 100000 Datensätze mit den in der jeweiligen Zeile angegebenen Verteilungsmodellen und Stichprobenumfänge erstellt und mit dem Anderson-Darling getestet werden,
-
das Signifikanzniveau α für den Anderson-Darling-Test ist 0,05, und
-
die prozentualen Anteile derjenigen Datensätze, für die der Anderson-Darling-Test einen p-Wert ≤ α berechnet, sollen in Spalte C5 gespeichert werden.
%ADD_sup_Simulationen_Zufallszahlen_versus_AD_Test C1 "Normal" C2 C3 C4 100000 0,05 C5
Wenn Sie zusätzlich in Spalte C6 und C7 die unteren und oberen Grenzen der 95%-Konfidenzintervalle für die simulierten Anteile nach dem Test von Anteilen für eine Stichprobe (Exakte Methode) speichern wollen, können Sie das Makro mit dem Befehl
%ADD_sup_Simulationen_Zufallszahlen_versus_AD_Test C1 "Normal" C2 C3 C4 100000 0,05 C5;
KIfuerSimulierteAnteile 95;
KIUnten C6;
KIOben C7.
aufrufen. Wir haben das für das Beispiel in der Einleitung gemacht und dabei folgende Simulationsergebnisse erhalten:
↓ | C1 | C2 | C3 | C4 | C5 | C6 | C7 |
Verteilung | Parameter 1 | Parameter 2 | Stichprobenumfang | Anteil der Tests mit p ≤ 0,05 | Untere 95%-KI-Grenze | Obere 95%-KI-Grenze | |
1 | Kleinster Extremwert | 10 | 0,05 | 80 | 81,22% | 80,98% | 81,46% |
2 | Kleinster Extremwert | 10 | 0,05 | 100 | 88,95% | 88,76% | 89,15% |
3 | Kleinster Extremwert | 10 | 0,05 | 120 | 93,92% | 93,77% | 94,06% |
In 81,22% unserer simulierten Datensätze mit Stichprobenumfang 80 hat der Anderson-Darling-Test einen p-Wert ≤ 0,05 berechnet und damit die Nullhypothese richtigerweise verworfen. Das 95%-Konfidenzintervall für diesen Anteil wurde als [80,98%, 81,46%] berechnet.
In 93,92% unserer simulierten Datensätze mit Stichprobenumfang 120 hat der Anderson-Darling-Test einen p-Wert ≤ 0,05 berechnet und damit die Nullhypothese richtigerweise verworfen. Das 95%-Konfidenzintervall für diesen Anteil wurde als [93,77%, 94,06%] berechnet.
Anmerkung
Durch die Simulation in diesem Beispiel wird nur geschätzt, wie gut der Anderson-Darling-Test die Nicht-Normalverteilung in dem Fall erkennt, dass eine Stichprobe in Wirklichkeit aus einer Kleinsten-Extremwert-Verteilung mit Lageparameter 10 und Skalenparameter 0,05 entnommen wurde. Daraus lässt sich keine Aussage ableiten, wie das im Fall anderer Nicht-Normalverteilungen wäre.
Befehle und Argumente
Das sind die Befehle und Argumente, mit denen Sie das Makro aufrufen können:
%ADD_sup_Simulationen_Zufallszahlen_versus_AD_Test dist1 dist2 par.1-par.m n anz α erg;
KIfuerSimulierteAnteile konf;
KIUnten uerg;
KIOben oerg;
Hinweis notiz;
SimulationsdatenSpeichern ordner.
Sie haben die folgende Bedeutung:
Befehl/Argument | Typ |
Bedeutung |
%ADD_sup_Simulationen_Zufallszahlen_versus_AD_Test | Hauptbefehl | Aufruf des Makros |
dist1 | Spalte oder Konstante | Verteilung für den Anderson-Darling-Test |
dist2 | Konstante | Verteilung für die Zufallszahlen |
par.1 | Spalte oder Konstante | Erster Verteilungsparameter für die Zufallszahlen |
par.2 | Spalte oder Konstante | Wenn benötigt: Zweiter Verteilungsparameter für die Zufallszahlen |
par.3 | Spalte oder Konstante | Wenn benötigt: Dritter Verteilungsparameter für die Zufallszahlen |
n | Spalte oder Konstante | Stichprobenumfang |
anz | Konstante | Anzahl der Simulationen |
α | Konstante | Signifikanzniveau für den Anderson-Darling-Test |
erg | Spalte | Ausgabespalte für die simulierten Anteile |
KIfuerSimulierteAnteile | Unterbefehl des Makroaufrufs |
Verwenden Sie diesen Unterbefehl, wenn Sie zusätzlich |
konf | Konstante | Konfidenzniveau der Konfidenzintervalle für die simulierten Anteile |
KIUnten | Unterbefehl von KIfuerSimulierteAnteile |
Verwenden Sie mindestens einen der Unterbefehle KIUnten und KIOben, |
uerg | Spalte | Spalte für die unteren Grenzen |
KIOben | Unterbefehl von KIfuerSimulierteAnteile | Verwenden Sie mindestens einen der Unterbefehle KIUnten und KIOben, wenn Sie für die simulierten Anteile berechnen lassen wollen. Wenn Sie nur KIOben verwenden, werden einseitige Obergrenzen ausgegeben. Wenn Sie KIUnten und KIOben verwenden, werden untere und obere KI-Grenzen ausgegeben. |
oerg | Spalte | Spalte für die oberen Grenzen |
Hinweis | Unterbefehl des Makroaufrufs |
Verwenden Sie diesen Unterbefehl, wenn Sie für die Simulationen die |
notiz | Spalte | Ausgabespalte für die Informationen über den Verteilungstyp der Zufallszahlen und über den Verteilungstyp für den Anderson-Darling-Test. |
SimulationsdatenSpeichern | Unterbefehl des Makroaufrufs |
Verwenden Sie diesen Unterbefehl, wenn dist1 nur eine Zeile hat und Sie |
ordner | Konstante | Verzeichnis, in das die Datei mit den Simulationsdaten gespeichert werden soll. |
Für die Zufallszahlen (dist1) kommen folgende Verteilungen in Frage:
Normal, Lognormal, Lognormal mit 3 Parametern, Gamma, Gamma mit 3 Parametern, Exponential, Exponential mit 2 Parametern, Kleinster Extremwert, Weibull, Weibull mit 3 Parametern, Größter Extremwert, Logistisch, Loglogistisch, Loglogistisch mit 3 Parametern, Beta, Cauchy, Chi-Quadrat, F, Laplace, t, Dreieck, Gleich
Für den Anderson-Darling-Test (dist2) kommen folgende Verteilungen in Frage:
Normal, Lognormal, Lognormal mit 3 Parametern, Gamma, Gamma mit 3 Parametern, Exponential, Exponential mit 2 Parametern, Kleinster Extremwert, Weibull, Weibull mit 3 Parametern, Größter Extremwert, Logistisch, Loglogistisch, Loglogistisch mit 3 Parametern
Die Parameter werden für die einzelnen Verteilungen (für die Zufallszahlen) in der folgenden Reihenfolge eingegeben:
dist1 | par.1 | par.2 | par.3 |
Normal | Mittelwert | Standardabweichung | |
Lognormal | Lage | Skala | |
Lognormal mit 3 Parametern | Lage | Skala | Schwellenwert |
Gamma | Form | Skala | |
Gamma mit 3 Parametern | Form | Skala | Schwellenwert |
Exponential | Skala | ||
Exponential mit 2 Parametern | Skala | Schwellenwert | |
Kleinster Extremwert | Lage | Skala | |
Weibull | Form | Skala | |
Weibull mit 3 Parametern | Form | Skala | Schwellenwert |
Größter Extremwert | Lage | Skala | |
Logistisch | Lage | Skala | |
Loglogistisch | Lage | Skala | |
Loglogistisch mit 3 Parametern | Lage | Skala | Schwellenwert |
Beta | Erster Formparameter | Zweiter Formparameter | |
Cauchy | Lage | Skala | |
Chi-Quadrat | Freiheitsgrade | ||
F | Freiheitsgrade des Zählers | Freiheitsgrade des Nenners | |
Laplace | Lage | Skala | |
t | Freiheitsgrade | ||
Dreieck | Unterer Endpunkt | Modalwert | Oberer Endpunkt |
Gleich | Unterer Endpunkt | Oberer Endpunkt |
Dieses Makro ist ein Beispiel für die Automatisierungsmöglichkeiten für Minitab. Trotz aller Sorgfalt übernehmen wir keine Gewährleistung für die Richtigkeit der Berechnungen und Ergebnisse.
|