2364

Minitab 22 - Kreuzkorrelation

  • Überarbeitet am 5.4.2024
  • Software: Minitab 22, 21, 20, 19, 18, 17

Wann erreicht der Lag einen kritischen Wert? Wie interpretiere ich die Werte der Kreuzkorrelationsfunktion (KKF)?

Erläuterung

Die Kreuzkorrelation ist ein Maß dafür, wie stark im Mittel der Zusammenhang zwischen den Wertepaaren x(t) und y(t+r) ist. In der Praxis wird die Kreuzkorrelation als Abweichungen vom arithmetischen Mittel berechnet.

In Minitab-Hauptmenü steht die Kreuzkorrelation unter Statistik: Zeitreihen: Kreuzkorrelation zur Verfügung. Wenn Sie in Minitab im Dialogfeld der Kreuzkorrelation die Option Standardanzahl der Lags auswählen, dann rechnet Minitab die Kreuzkorrelation für alle Werte aus, die Lag annehmen kann. Das Intervall ergibt sich dabei aus der Formel

±n+10

wobei n die Anzahl der Beobachtungen ist.

Basierend auf großen Stichproben wird häufig eine Approximation an eine Normalverteilung verwendet, um zu entscheiden, ob die Kreuzkorrelation einer bestimmten Stichprobe um einen Stichprobenfehler von 0 streut. Dies ist äquivalent dazu, zu testen, ob die Kreuzkorrelation der Grundgesamtheit von Lag k = 0 ist. Wenn die Kreuzkorrelation der Grundgesamtheit von Lag k für

k=1, 2, ...

gleich 0 ist, dann ist der Korrelationskoeffizient nahezu normalverteilt. Die Parameter der Verteilung sind dann

x¯=0

und

s=1n-k

wobei n die Anzahl der Beobachtungen und k der Lag ist. Analog ist

s=1n+k

für k= -1, -2,....

Da ungefähr 95% der normalverteilten Grundgesamtheit innerhalb von zwei Standardabweichungen liegen, ist das Signifikanzniveau eines Hypothesentests zur Kreuzkorrelation ungefähr 5%. Wenn also der Betrag des Korrelationskoeffizienten für k größer als zwei Standardabweichungen ist, verwirft man die Hypothese, dass die Kreuzkorrelation der Grundgesamtheit von Lag k = 0 ist, mit einen Signifikanzniveau von ungefähr 5%.

Beispiel 1

Als Beispiel werden hier zwei Spalten mit je zehn Werten verglichen, die aus den gleichen Zahlen bestehen. Die zweite Spalte entspricht der ersten mit einer Verschiebung um 3 Reihen, d.h. in Reihe 1 der Spalte C1 und in Reihe 4 von Spalte C2 befinden sich die gleichen Zahlen, entsprechend in 2 und 5, 3 und 6 usw..
Als Lag wurde im Dialog 3 eingegeben; die Kreuzkorrelation wird also von k = -3 bis k = +3 berechnet.

KKF - Korrelaten C1(t) und C2(t+k)

-3 -0.306
-2 -0.162
-1 0.021
0 0.068
1 -0.47
2 0.001
3 0.778

In der vorderen Spalte erscheint der verwendete Lag k, dahinter die berechneten Werte für KKF (die Kreuzkorrelationsfunktion). Der Lag mit dem betragsmäßig größten Wert von KKF ist der Lag 3. Der kritische Wert berechnet sich hierfür durch

2n-k

was in diesem Beispiel

210-30,755929

entspricht. Da der kritische Wert für Lag 3 kleiner als 0,778 (dem Wert von KKF für k=3) ist, ist dies signifikant und zeigt an, dass C1 und C2 bei Lag 3 stark korreliert sind. Somit verwirft man die Hypothese einer Kreuzkorrelation für Lag 3 = 0.

Beispiel 2

Als zweites Beispiel sei eine Tabelle mit den folgenden Werten gegeben.

C1 C2
     
1 6,714849452790967 7,206684332230956
2 11,87961144917019 16,114746011916424
3 6,42295159005984 7,547079505592157
4 7,612616224312163 12,705287503561133
5 11,047738007211752 7,460097566282116
6 8,53771975230822 8,771128779547018
7 12,026447236292528 12,013300035899682
8 8,557368219540217 9,465851609848622
9 10,913471064345783 12,994916427969958
10 11,935915350344118 9,4931374864902

 Das Plotten dieser Daten über Grafik: Zeitreihendiagramm: Mehrere beziehungsweise Statistik: Zeitreihen: Zeitreihendiagramm liefert dieses Bild:

id_2364_kreuzkorrelation_beispiel_mit_x-y-verschiebung_01

Die Kreuzkorrelationsanalyse ergibt, dass der höchste KKF-Wert mit 0,613262 bei einem Lag von 2 liegt:

ARBEITSBLATT 1

Kreuzkorrelationsfunktion: C1; C2

 
KKF - Korrelaten C1(t) und C2(t+k)

Kreuzkorrelationen

LagKKF
-5 0,276823
-4 -0,465160
-3 0,470855
-2 -0,224505
-1 -0,235807
0 0,510896
1 -0,583073
2 0,613262
3 -0,298649
4 0,101359
5 0,080864

id_2364_kreuzkorrelation_beispiel_mit_x-y-verschiebung_02

Sie können über Berechnen: Rechner eine neue Spalte mit den hier zu sehenden Eingaben erstellen:

Ergebnis Speichern in:  C3
Ausdruck: Lag(C1;2)

Sie erhalten dann eine Spalte C3, deren Muster durch die Verschiebung schon mehr dem in Spalte C2 ähnelt:

C1 C2 C3
       
1 6,714849452790967 7,206684332230956 *
2 11,87961144917019 16,114746011916424 *
3 6,42295159005984 7,547079505592157 6,714849452790967
4 7,612616224312163 12,705287503561133 11,87961144917019
5 11,047738007211752 7,460097566282116 6,42295159005984
6 8,53771975230822 8,771128779547018 7,612616224312163
7 12,026447236292528 12,013300035899682 11,047738007211752
8 8,557368219540217 9,465851609848622 8,53771975230822
9 10,913471064345783 12,994916427969958 12,026447236292528
10 11,935915350344118 9,4931374864902 8,557368219540217

id_2364_kreuzkorrelation_beispiel_mit_x-y-verschiebung_03

Question?

Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein., wenn Sie eine Frage zu diesem Artikel haben.