ARIMA: So erhalten Sie beim Analysieren von Zeitreihendaten die relevanten Informationen

Um aus Zeitreihendaten die benötigten Informationen zu erhalten, sind Können und Erfahrung, vielleicht auch Inspiration und Fingerspitzengefühl gefragt. In diesem Artikel wird beschrieben, wie Sie Zeitreihendaten mit fortgeschrittenen Werkzeugen analysieren, die in Grundlagen-Schulungsprogrammen zur Statistik selten behandelt werden.

Von Michel Thirion und Robert Collis, Experte für technische Schulungen bei Minitab

Thirion and CollisThirion and Collis

Die Zeit, die Mitarbeiter in einem Center für technischen Support für Telefonate mit Kunden aufwenden

In der Fertigungs- und Dienstleistungsbranche sind Zeitreihendaten weit verbreitet. Beispiele:

  • Die Anzahl der Tage, die ein Kunde darauf wartet, eine Antwort auf einen Hypothekenantrag zu erhalten
  • Die Zeit, die benötigt wird, bis ein Anruf bei einer Bank entgegengenommen wird
  • Die Zeit, die Mitarbeiter in einem Center für technischen Support für Telefonate mit Kunden aufwenden
  • Der Verkauf mit Helikoptermotoren im zeitlichen Verlauf
  • Die Zeit, die Mitarbeiter eines Pharmaunternehmens zum Ausfüllen von wichtigen Dokumenten benötigen

Das Analysieren solcher Daten scheint zunächst einfach zu sein – ist dies jedoch wirklich der Fall?

Beim Analysieren von Zeitreihendaten besteht der erste Schritt häufig im Erstellen von statistischen Regelkarten. Wir können beispielsweise ein Verlaufsdiagramm erstellen, indem wir Statistik > Qualitätswerkzeuge > Verlaufsdiagramm auswählen und das Dialogfeld wie folgt ausfüllen:

Es reicht niemals aus, die Datenanalyse einfach nach einer bestimmten Anleitung durchzuführen. Zum Extrahieren der benötigen Informationen aus Zeitreihendaten sind zweifellos Können und Erfahrung erforderlich, jedoch benötigen Sie auch Inspiration und Fingerspitzengefühl, um Prozesse ordnungsgemäß zu überwachen, damit entsprechende Korrekturen vorgenommen werden können.

  

Dank meiner Erfahrungen in den Honeywell Master Black Belt-Schulungen und bei der Betreuung der Veranstaltungen von Minitab konnte ich Zeitreihendaten mit weniger bekannten, fortgeschrittenen Werkzeugen analysieren, die in Grundlagen-Schulungsprogrammen zur Statistik häufig außer Acht gelassen werden. Dieser Artikel soll Ihnen zeigen, wie Sie einige dieser Verfahren in der Minitab Statistical Software anwenden.

Nachdem auf OKgeklickt wurde, generiert Minitab das folgende Diagramm:

Beim Analysieren von Zeitreihendaten besteht der erste Schritt häufig im Erstellen von statistischen Regelkarten. Wir können beispielsweise ein Verlaufsdiagramm erstellen, indem wir Statistik > Qualitätswerkzeuge > Verlaufsdiagramm auswählen und das Dialogfeld wie folgt ausfüllen:

ARIMA Image 01

Unerfahrene Benutzer versuchen eventuell, eine I/MR-Karte zu erstellen, indem sie Statistik > Regelkarten > Regelkarten für Variablen (Einzelwerte) > I/MR auswählen und das Dialogfeld wie folgt ausfüllen:

ARIMA article - image 2

Durch Klicken auf OK wird die folgende Ausgabe erzeugt:

Unerfahrene Benutzer versuchen eventuell, eine I/MR-Karte zu erstellen, indem sie Statistik > Regelkarten > Regelkarten für Variablen (Einzelwerte) > I/MR auswählen und das Dialogfeld wie folgt ausfüllen:

ARIMA Article Image 3

Um die Verwendung von Regelkarten wie diese zu rechtfertigen, müssen jedoch Standardannahmen erfüllt werden. Insbesondere müssen die Daten normal und unabhängig voneinander verteilt sein, mit dem Mittelwert μ und der Standardabweichung σ1.

ARIMA article image 4

Die Eingriffsgrenzen auf der I-Karte basieren auf dem Mittelwert der gleitenden Spannweite: der absoluten Differenz zwischen den einzelnen aufeinander folgenden Paaren von Punkten. Wenn zwischen den Punkten keine Unabhängigkeit besteht, liegt eine als Autokorrelation bezeichnete Bedingung vor, d. h., die Differenz zwischen den aufeinander folgenden Paaren von Punkten ist gering. Das bedeutet, dass die gleitende Spannweite unnatürlich gering ist, und dies führt zu einer Zunahme der Rate falscher Alarme auf der I-Karte.

Wie können Sie erkennen, ob Daten autokorreliert sind?

Offensichtlich kann die Verwendung einer I-Karte mit autokorrelierten Daten Probleme verursachen. Daher ist es hilfreich zu wissen, ob die Daten autokorreliert sind. Glücklicherweise wird dies durch den Assistenten in der Minitab Statistical Software überprüft, ohne dass wir in der Software komplizierte Optionen verwenden müssen.

Wenn wir Assistant > Regelkarten > I/MR-Karte auswählen und dann das Dialogfeld wie unten dargestellt ausfüllen, gibt der Assistent eine Warnung aus:

ARIMA Article Image 5

Der Assistent informiert uns außerdem über die Autokorrelation und ihre Folgen:

ARIMA Article image 6

Wir hätten zum Erstellen der I/MR-Karte von vornherein den Assistenten verwenden sollen. Ohne den Assistenten ziehen viele Benutzer falsche Schlussfolgerungen.

Umgang mit der Autokorrelation in Minitab

Bedeutet die Autokorrelation, dass die Daten nicht verwendet werden können?  Doch, das geht, aber wir müssen eine differenziertere Vorgehensweise verfolgen.

Um die Korrelationen zwischen den Daten zu verschiedenen Zeitpunkten, die um einen oder mehrere Perioden auseinander liegen, zu ermitteln, können wir eine Analyse der Autokorrelation und der partiellen Autokorrelation durchführen. So können wir bestimmen, ob zwischen den Daten zum Zeitpunkt t und zu den Zeitpunkten t-1, t-2 bis t-k Korrelationen vorhanden sind.

Wir wählen Statistik > Zeitreihen > Autokorrelation und füllen das Dialogfeld wie folgt aus:

ARIMA Article Image 7

Nachdem wir auf „OK“ geklickt haben, erzeugt Minitab die folgende Ausgabe:

ARIMA article image 8

Die partielle Autokorrelationsfunktion lässt sich entsprechend durch folgende Auswahl berechnen:

Statistik > Zeitreihen > Partielle Autokorrelationsfunktion

ARIMA article image 9

Die vertikalen Linien, die über die horizontalen roten gepunkteten Linien herausragen, geben eine starke Korrelation zwischen Zeitpunkten an, die um ein und zwei Perioden auseinander liegen. Jetzt können wir die Autokorrelation eliminieren, indem wir jeden dritten Datenpunkt auf einer I/MR-Karte darstellen. Wählen Sie Statistik > Regelkarten > Regelkarten für Variablen (Einzelwerte) >I/MRR aus, und füllen Sie das Dialogfeld wie folgt aus:

ARIMA article image 10

Um nur jeden dritten Wert auszuwählen, klicken Sie auf Datenoptionen... und füllen das Unterdialogfeld wie folgt aus, bevor Sie in jedem Dialogfeld auf „OK“ klicken:

ARIMA article image 11

Minitab erzeugt das folgende Diagramm:

ARIMA article image 12

Der Prozess scheint unter Kontrolle zu sein, und die zugrunde liegenden Annahmen wurden erfüllt. Jedoch wurden zwei Drittel der Daten ausgelassen. In Anbetracht der geringen Anzahl von Werten in der Zeitreihenspalte hätten wir die Daten auch in relativ große Teilgruppen unterteilen können, um eine relativ geringe Anzahl von Punkten auf der X-quer-Karte zu erhalten. Keine dieser Optionen ist ideal.

Die beste Lösung ist die Verwendung der Zeitreihenmodellierung, insbesondere der ARIMA-Methode (Autoregressive Integrated Moving Average, autoregressive integrierte gleitende Durchschnitte). Diese Methode ist in Industrie- und Unternehmenskreisen nicht sehr bekannt, sie lässt sich jedoch relativ leicht anwenden, sofern einige grundlegende Schritte verstanden wurden. Zum Ermitteln der besten Lösung ist jedoch möglicherweise etwas Fingerspitzengefühl erforderlich. Dabei muss die Person, die die Analyse durchführt, eventuell mehr Kunstgriffe als wissenschaftliche Kenntnisse anwenden.

Erstellen eines ARIMA-Modells

Bei der ARIMA-Modellierung werden ganz einfach Daten aus der jüngeren oder entfernteren Vergangenheit genutzt, um die vorhandenen Daten zu modellieren und zuverlässige Vorhersagen zum zukünftigen Verhalten zu treffen.  Es soll ein zugrunde liegendes Modell bestimmt werden, das die Änderung im Prozess erklärt. Jeder Punkt, der von diesem prognostizierten Verhalten abweicht, lässt sich als Ausnahmebedingung auffassen, da er nicht den allgemeinen Änderungen in den Daten entspricht.

Damit ein ARIMA-Modell erstellt werden kann, müssen die Daten stationär sein; das bedeutet, dass der Prozess weder einen Aufwärts- noch einen Abwärtstrend aufweisen darf. Mit anderen Worten, es muss eine bestimmte Stabilität des Prozessmittelwerts erreicht werden. Die ursprünglichen Daten waren nicht stationär, sondern es schien ein Aufwärtstrend im zeitlichen Verlauf vorhanden zu sein. Mit dem Werkzeug „Differenz“ in Minitab lassen sich die Daten in stationär

e Daten ändern Statistik > Zeitreihen > Differenz.

Wir füllen das Dialogfeld wie folgt aus:

ARIMA article image 13

Nachdem wir auf „OK“ geklickt haben, generiert Minitab eine Spalte mit den angegebenen Differenzen. Wenn die Daten zum Zeitpunkt t als Xt und die Daten in der Periode vor t als Xt-1 bezeichnet werden, ist die Differenz Xt-Xt-1.

Jetzt können wir die Differenzen darstellen, indem wir Grafik > Zeitreihendiagramm > Einfach auswählen und das Dialogfeld wie folgt ausfüllen:

ARIMA article image 14

Durch Klicken auf „OK“ wird die folgende Grafik erzeugt:

ARIMA article image 15

Die Daten, auf die wir eine Differenz der Ordnung 1 angewendet haben, scheinen stationär geworden zu sein und keinen eindeutigen Aufwärts- oder Abwärtstrend aufzuweisen. Daher können wir diese Daten zum Bestimmen eines ARIMA-Modells verwenden.

Zunächst führen wir eine Analyse der Autokorrelation und partiellen Autokorrelation der Daten aus, deren Differenz gebildet wurde. Minitab liefert die folgenden Ergebnisse:

ARIMA Article image 16.2
ARIMA article image 17

Jetzt müssen wir die Muster in der Autokorrelations- und partiellen Autokorrelationsfunktion interpretieren. Ein hilfreiches Dokument hierzu ist Forecasting, Methods and Applications von Makridakis, Wheelwright und Hyndman (John Wiley and Sons, Third Edition, 1998).

Die Autokorrelationsfunktion weist ein sinusförmiges Muster und Spitzen für die Lags 1 bis 3 auf. Dies lässt auf ein autoregressives Modell der Ordnung 3 bzw. AR(3) schließen. Sinusförmiges Verhalten der partiellen Autokorrelationsfunktion und Spitzen bis zu Lag 3 lassen auf ein Modell des gleitenden Durchschnitts der Ordnung 3 bzw. MA(3) schließen.  Die Zeitreihenmodellierung kann zuweilen ein iterativer oder sogar unsicherer Prozess sein, jedoch legen diese Grafiken nahe, dass sich zunächst die Verwendung des ARIMA(3,1,3)-Modells empfiehlt.

Jeder Teil des ARIMA-Modells hat eine bestimmte Aufgabe in den Prognosen des Modells. Der autoregressive Teil des Modells prognostiziert den Wert zum Zeitpunkt t, indem frühere Werte in der Reihe zum Zeitpunkt t-1, t-2 usw. berücksichtigt werden. Der gleitende Durchschnitt verwendet frühere Residuenwerte, d. h. die Differenzen zwischen dem tatsächlichen Wert und dem auf Grundlage des Modells prognostizierten Wert zum Zeitpunkt t.

Wir können bestimmen, wie gut sich das ARIMA(3,1,3)-Modell für die Daten eignet, indem wir Statistik > Zeitreihen > ARIMA auswählen und das Dialogfeld wie unten dargestellt ausfüllen:

ARIMA Image 18

Minitab erzeugt die folgende Ausgabe:

ARIMA Article Image 19

Die p-Werte sind nur auf einem Niveau von 10 % für den Koeffizienten der Ordnung 1 des autoregressiven Teils des Modells und den Koeffizienten der Ordnung 3 des Teils mit dem gleitenden Durchschnitt des Modells signifikant. Zudem deutet die Ljung-Box-Chi-Quadrat-Statistik, mit der die gesamte Zufälligkeit des Modells überprüft wird, darauf hin, dass ein saisonaler Effekt von mindestens der Ordnung 1 auftritt.

Darum verfeinern wir die Interpretation dieser Daten, indem wir ein ARIMA(1,1,3)(1,0,0)12 -Modell erstellen.  Diese Notation ist einfacher als es zunächst scheint. Der erste Satz Klammern besagt, dass die Lags für den autoregressiven (AR) Teil und den integrierten Teil (I) des Modells 1 lauten und dass der gleitende Durchschnitt (MA) auf Lag 3 basiert. Der zweite Satz Klammern gibt den saisonalen Effekt an, von dem wir annehmen, dass er einem Zyklus von 12 Perioden, d. h. einem Jahreszyklus, um AR(1) folgt.

Lassen Sie uns das Modell testen. Mit der praktischen Minitab-Tastenkombination CTRL-E—recalls the last dialog box we used. Now we can construct the refined ARIMA model by filling the dialog out as shown:

ARIMA article image 20a

Klicken Sie auf „Speichern“, und wählen Sie „Residuen“ und „Anpassungen“ aus, bevor Sie auf „OK“ klicken:

ARIMA Article image 20b

Nachdem Sie in beiden Dialogfeldern auf „OK“ geklickt haben, gibt Minitab Folgendes aus:

ARIMA article image 20c

Der autoregressive Koeffizient der Ordnung 1, der saisonale Koeffizient und der Koeffizient der Ordnung 3 für den gleitenden Durchschnitt sind auf dem Alpha-Niveau von 10 % signifikant. Dies bedeutet, dass es sich möglicherweise um ein effizientes Modell handelt. Die Summe der Quadrate, die als Maß der Summe der quadrierten Differenzen zwischen den einzelnen ursprünglichen Datenpunkten und ihren mit diesem ARIMA-Modell geschätzten Werten dient, ist recht klein. Außerdem weist die Ljung-Box-Chi-Quadrat-Statistik keine Korrelationen zwischen Punkten mit einer Differenz von 12 oder 24 Lags auf. Die Korrelationen wurden durch den Einschluss des saisonalen Koeffizienten eliminiert.

Jetzt möchten wir bestimmen, wie gut das Modell auf die ursprünglichen Werte passt, und ermitteln, was das Modell für die Zukunft des Prozesses prognostiziert. Um die Anpassung des Modells zu bestimmen, wählen wir Grafiken > Zeitreihendiagramm > Mehrfach aus und füllen das Dialogfeld wie folgt aus:

ARIMA Article image 20

Minitab erzeugt die folgende Grafik:

ARIMA article image 21

Wählen Sie „Prognosen“, und füllen Sie die Dialogfelder wie folgt aus, bevor Sie in jedem Dialogfeld auf „OK“ klicken:

Um die prognostizierten zukünftigen Werte anzuzeigen, wählen Sie Statistik > Zeitreihen > ARIMA, und dann „Grafiken“ aus. Füllen Sie anschließend das Dialogfeld wie folgt aus, bevor Sie auf „OK“ klicken:

ARIMA Article Image 22

Wählen Sie „Prognosen“, und füllen Sie die Dialogfelder wie folgt aus, bevor Sie in jedem Dialogfeld auf „OK“ klicken:

ARIMA Article Image 23

Minitab erzeugt die folgende Grafik mit Prognosen:

ARIMA Article Images 24

Das prognostizierte zukünftige Verhalten des Prozesses ist in Anbetracht der früheren Daten plausibel. Mit einer größeren Menge von Daten lässt sich das Konfidenzintervall von 95 % noch weiter verringern.

Wie in der Regressions- oder ANOVA-Modellierung muss bei der ARIMA-Modellierung unbedingt das Verhalten der Residuenwerte untersucht werden, um zu bestimmen, ob sie normalverteilt und zufällig sind und eine konstante Streuung aufweisen.

Bei diesen Residuenwerten handelt es sich um die Differenzen zwischen dem beobachteten Wert zum Zeitpunkt t und dem auf Grundlage des ARIMA-Modells prognostizierten Wert. Die Differenzen können negativ oder positiv sein. Gelegentlich können sie 0 sein, wenn es sich um eine perfekte Anpassung handelt.

ARIMA Article Image 25

Die Annahmen sind weitgehend erfüllt, mit Ausnahme einer nicht konstanten Streuung in der Darstellung der Residuen vs. Anpassungen. Der Grund hierfür ist, dass das Modell für frühe Datenpunkte eine bessere Anpassung als für neuere Datenpunkte liefert.

Für diese Residuenwerte liegt keine Autokorrelation vor. Daher empfiehlt es sich, die Residuenwerte mit dem Assistenten auf einer I/MR-Karte darzustellen, um zu ermitteln, welche Punkte vom erwarteten Verhalten abweichen, d. h., welche Punkte nicht dem Modell entsprechen.

Wir wählen Assistent > Regelkarten > I/MR-Karte und füllen das Dialogfeld wie folgt aus:

ARIMA Article Image 26

Minitab erzeugt die folgende Ausgabe:

ARIMA Article Image 27

Ein Datenpunkt, und zwar 26, lag außerhalb der Eingriffsgrenzen. Eine mögliche Ursache hierfür ist eine unerwartete und drastische Änderung zwischen Punkt 25 und 26.  Gemäß dem ARIMA-Modell ist eine Entwicklung in diesem Prozess zu erwarten, jedoch interpretieren wir die Datenreihe so, dass dieser speziellen Änderung nur eine einzige Ausnahmebedingung zugrunde liegt.

Angenommen, Sie versuchen, die Änderungen im Wert einer bestimmten Aktie zu verstehen, und der neueste Trend war ein Abwärtstrend, da das Unternehmen starkem Wettbewerb ausgesetzt ist. Sie können dieses Phänomen mit dem ARIMA-Verfahren modellieren. Wenn der CEO des Unternehmens, der an der Börse kein hohes Ansehen genießt, ankündigt, dass er seine Position in einem Jahr aufgibt, kann dies zu einer abrupten Wertsteigerung der Aktie führen, so dass das auf Grundlage des aktuellen Modells erwartete Ergebnis für diesen Tag übertroffen wird. Dies würde sich in den Residuen widerspiegeln und eine eindeutige Ausnahmebedingung sein.

Was stellt das ARIMA-Modell tatsächlich dar?

Die folgenden Ausführungen sind vor allem für fortgeschrittene Benutzer interessant, da einige Ableitungen recht komplex sind.

Der prognostizierte Wert zum Zeitpunkt t hängt von den früheren Werten in der Reihe und gleichermaßen von den früheren Residuenwerten ab.

Es ist hilfreich, die Grundlagen der Notation zu kennen, insbesondere die Notation mit Verzögerungsoperatoren, die in der Zeitreihenanalyse allgemein verwendet wird.

  • Yt ist der Datenwert zum Zeitpunkt t
  • Yt-Dach ist der auf Grundlage des Modells prognostizierte Wert zum Zeitpunkt t
  • et ist der Residuenwert zum Zeitpunkt t, d. h. die Differenz Yt -Yt-Dach

Häufig wird der Verzögerungsoperator B verwendet.

  • BY t = Y t-1
  • B(BYt) =B2 Yt =Yt-2

Wie ist das ARIMA(1,1,3)(1,0,0)12-Modell konzipiert?

Das Modell besteht aus zwei Teilen: Autoregression (AR) und gleitender Durchschnitt (MA). Außerdem muss eine Differenzbildung der Ordnung 1 eingeschlossen werden (Yt-Yt-1).

Autoregressive Komponenten

Beginnen wir mit der autoregressiven Seite der Gleichung, die von den früheren Werten in der Reihe abhängt. Diese Komponente des Modells enthält drei verschiedene Teile:

Autoregressiver Term der Ordnung 1: (1-φ1B)Yt=Yt-φ1Yt-1

Saisonale AR(1): (1-θB12)Yt=Yt-θYt-12

Nicht saisonale Differenz: (1-B)Yt=Yt-Yt-1

Der autoregressive Term der Ordnung 1, die saisonale AR(1) und die nicht saisonale Differenz werden multipliziert und dann abgearbeitet.

(1-φ1B) (1-θB12) (1-B)Yt = (1-φ1B-θB12+φ1B-θB13)(1-B)Yt = (1-B)Yt - φ1B(1-B)Yt -θB12(1-B)Yt +φ1θB13(1-B)Yt=Yt-Yt-1-φ1(Yt-1-Yt-2)-θ(Yt-12-Yt-13)+φ1θYt-13-Yt-14)

Beachten Sie, dass das Modell sowohl die neueren Datenwerte Yt-1, Yt-2 als auch viel ältere Datenwerte enthält, z. B. Yt-13 und Yt-14.

Komponenten des gleitenden Durchschnitts

Die Seite mit dem gleitenden Durchschnitt der Gleichung lässt sich weitaus leichter konstruieren. Sie beruht auf den Residuen der früheren Perioden im Hinblick auf den Zeitpunkt t, d. h. den Zeitpunkt, für den mit dem Modell eine Vorhersage getroffen werden soll. Für diesen „gleitenden Durchschnitt“ gilt nicht die klassische Definition. Herkömmlicherweise werden zum Erstellen eines gleitenden Durchschnitts der Ordnung 3 die Mittelwerte von 3 aufeinander folgenden Datenpunkten auf einer Karte verfolgt. Wir verwenden jedoch eine vollkommen andere Vorgehensweise.

Der Teil des gleitenden Durchschnitts im Modell lautet:

(1-ψ1B-ψ2B23B3)et =
et1e

Die autoregressive Seite der Gleichung und die Seite mit dem gleitenden Durchschnitt werden als gleich definiert, indem auf der rechten Seite der konstante Term addiert wird. Das Ergebnis lautet wie folgt.-ψYt-Yt-1-φ1(Yt-1-Yt-2)-φ1θ(Yt-12-Yt-13)+φ1θ(Yt-13-Yt-14)=β+ etψ1et-1-ψ2et-2-ψ3et-32et-23et-3

Die autoregressive Seite der Gleichung und die Seite mit dem gleitenden Durchschnitt werden als gleich definiert, indem auf der rechten Seite der konstante Term addiert wird. Das Ergebnis lautet wie folgt.

Yt-Yt-11(Yt-1-Yt-2)-φ1θ(Yt-12-Yt-13)+φ1θ(Yt-13-Yt-14)=β+ etψ1e

Wenn Yt auf der linken Seite der Gleichung und alle anderen Terme auf der rechten Seite angeordnet werden, lautet das Ergebnis, ausgedrückt als prognostizierter Wert zum Zeitpunkt t, wie folgt:-ψ2eYt= β+Yt-1 +φ1(Yt-1-Yt-2) +θ(Yt-12-Yt-13) +φ1θ(Yt-13-Yt-14)-ψ1et-1-ψ2et-2-ψ3et-3+ et3et-3

Wenn Yt auf der linken Seite der Gleichung und alle anderen Terme auf der rechten Seite angeordnet werden, lautet das Ergebnis, ausgedrückt als prognostizierter Wert zum Zeitpunkt t, wie folgt:

Yt= β+Yt-11(Yt-1-Yt-2) +θ(Yt-12-Yt-13) +φ1θ(Yt-13-Yt-14)-ψ1et-1Wir können den prognostizierten Wert zum Zeitpunkt t wie im klassischen Regressionsmodell ableiten. Das bedeutet, wenn Yt= Modell + et, dann Y-Dacht = Modell Daher ist Y-Dacht = β+Yt-1 +φ1(Yt-1-Yt-2) +θ(Yt-12-Yt-13)-φ1θ(Yt-13-Yt-14)-ψ1et-1-ψ2et-2-ψ3et-3et-23et-3+ et

Wir können den prognostizierten Wert zum Zeitpunkt t wie im klassischen Regressionsmodell ableiten. Das bedeutet, wenn Yt= Modell+ et, then Yhatt = Modell Daher ist Y-Dacht = β+Yt-11(Yt-1-Yt-2) +θ(Yt-12-Yt-13)-φ1θ(Yt-13-Yt-14)-ψ1eY-Dacht  = 0,00066 + Yt-1 + 0,4139(Yt-1-Yt-2) + 0,9817(Yt-12-Yt-13) – 0,4139*0,9817(Yt-13-Yt-14) – (-0,1549)*et-1 - 0,1507*et-2 - 0,8431*et-32et-23et-3

Y-Dacht  = 0.00066 + Yt-1 + 0.4139(Yt-1-Yt-2) + 0.9817(Yt-12-Yt-13) – 0.4139*0.9817(Yt-13-YDer prognostizierte Wert in der 16. Periode wird wie folgt ausgedrückt:) – (-0.1549)*eY-Dach16 = 0,00066 + Y15 + 0,4139(Y15 – Y14) + 0,9817(Y4 – Y3) – 0,4139*0,9817(Y3 – Y2) – (-0,1549)*e15 - 0,1507*e14 - 0,8431*e13 - 0.1507*et-2 - 0.8431*et-3

Der prognostizierte Wert in der 16. Periode wird wie folgt ausgedrückt:

Y-Dach16 = 0.00066 + Y15 + 0.4139(Y15 – Y14) + 0.9817(Y4Y3) – 0.4139*0.9817(YLassen Sie uns jetzt veranschaulichen, wie diese Gleichung verwendet werden kann. – YDie folgende Tabelle enthält die ursprünglichen Daten für die Perioden t=-4 bis t=+11. Dabei ist t=1 die erste Periode, für die Daten vorliegen. Die ursprünglichen Daten für die Perioden t=1 bis t=11 befinden sich in den Zellen B8 bis B17.) – (-0.1549)*e15 - 0.1507*e14 - 0.8431*eDer erste Schritt der Analyse erfolgt in Minitab im Hintergrund, wenn zum Anpassen des ARIMA-Modells Y0, Y-1,Y-2usw. berechnet wird. Dabei werden im Grunde prognostizierte Datenwerte vor t=1 erzeugt.

Lassen Sie uns jetzt veranschaulichen, wie diese Gleichung verwendet werden kann.

Die folgende Tabelle enthält die ursprünglichen Daten für die Perioden t=-4 bis t=+11. Dabei ist t=1 die erste Periode, für die Daten vorliegen. Die ursprünglichen Daten für die Perioden t=1 bis t=11 befinden sich in den Zellen B8 bis B17.

ARIMA Article Image 39

Der erste Schritt der Analyse erfolgt in Minitab im Hintergrund, wenn zum Anpassen des ARIMA-Modells Y0, Y-1,YDie rückwärts gerichtete Prognose für den Zeitpunkt 0 lautet 1,623. Daher ist Y1-Y0=1,623 und folglich ist Y0=59,7-1,6=58,1. Dies entspricht anforderungsgemäß Zelle B6. Der gleiche Prozess lässt sich für Y-1,Y-2usw. anwenden (aufwärts in Spalte B der oben gezeigten Tabelle). Y0-Y-1=-2,121 Y-1=Y0+2,121=58,1+2,1=60,2. Dies entspricht Zelle B5.

Es scheint nicht sinnvoll zu sein, Y0 zu berechnen, da dieser Wert vor dem Untersuchungszeitraum liegt. Rückwärts gerichtete Prognosen werden ausgeführt und können im Sessionfenster angezeigt werden:

ARIMA Article Image 40

Die rückwärts gerichtete Prognose für den Zeitpunkt 0 lautet 1,623. Daher ist Y1-Y0=1,623 und folglich ist Y0=59,7-1,6=58,1. Dies entspricht anforderungsgemäß Zelle B6. Der gleiche Prozess lässt sich für Y-1,Y-2usw. anwenden (aufwärts in Spalte B der oben gezeigten Tabelle). Y0-Y-1.

Die endgültige Gleichung für die 10. Periode lautet:

Y-Dach <t = 0,00066 + Yt-1 + 0,4139(Yt-1 – Yt-2) + 0,9817(Yt-12 – Yt-13) – 0,4139*0.9817(Yt-13 – YY-Dach10 = 0,00066 + Y9 + 0,4139(Y9 – Y8) + 0,9817(Y-2 – Y-3) – 0,4139*0,9817(Y-3 – Y-4) – (-0,1549)*e9 - 0,1507*e8 - 0,8431*e7) – (-0,1549)*et-1 - 0,1507*et-2 - ,.8431*et-3

Y-Dach10 = 0,00066 + Y9 + 0,4139(Y9 – Y8) + 0,9817(Y-2 – Y-3) – 0,4139*0,9817(YY9 ist Zelle B15 in der Tabelle oben = 63,6 Y8 ist Zelle B14 = 61,9 Y-2 ist Zelle B4 = 60,444 Y-3 ist Zelle B3 = 60,535 Y-4 ist Zelle B2 = 58,809 e9 ist Zelle D15 = -0,000376466 e8 ist Zelle D14 = 0,012395082 e7 ist Zelle D13 = 0,039578177 – Y-4) – (-0.1549)*e9 - 0.1507*e8 - 0.8431*e7

Auf die gleiche Weise lassen sich auf Grundlage dieses Modells die prognostizierten Werte jeder Periode bestimmen.

Schlussfolgerungen

Die meisten Fachleute analysieren Zeitreihen- oder Prozessdaten auf eine eher vereinfachende Weise. Dabei nutzen sie hauptsächlich Verlaufsdiagramme oder einfache Shewhart-Regelkarten, z. B. I/MR-, X-quer/R- oder X-quer/S-Karten.

Jedoch kann Autokorrelation in den Daten die Rate falscher Alarme in die Höhe treiben. Das Modellieren der Daten mit einem differenzierten Verfahren der Zeitreihenmodellierung wie ARIMA kann sinnvoll sein. Bei richtiger Anwendung kann ARIMA eine gute Anpassung an vorhandene Daten und korrekte Prognosen von zukünftigem Verhalten bieten, was in einer von Unwägbarkeiten geprägten Welt wichtig ist. ARIMA-Verfahren sind aber eher komplex und weniger bekannt als einfachere Analysen. Wenn die Grundsätze verstanden wurden, lassen sich mit Minitab jedoch relativ leicht nützliche Zeitreihenmodelle erstellen. Nachdem das ARIMA-Modell erstellt wurde, empfiehlt es sich zudem, die Residuenwerte auszuwerten, um zu bestimmen, ob Ausnahmebedingungen vorhanden sind.


1 Montgomery, Douglas (2005). Introduction to Statistical Quality Control. John Wiley and Sons, 5th Edition. Page 438.

  • Minitab News

    In unserem kostenlosen monatlichen E-Newsletter finden Sie die aktuellen Neuigkeiten rund um Minitab, Lernprogramme, Fallstudien, Statistiktipps und weitere nützliche Informationen.

    Registrieren
  • Folgen Sie Minitab

    Verbinden Sie sich mit Minitab auf LinkedIn Folgen Sie Minitab auf Twitter Geben Sie Minitab auf Facebook ein „Gefällt mir“
  • Weitere Artikel

Durch Ihre Nutzung dieser Website stimmen Sie zu, dass Cookies verwendet werden. Cookies dienen zu Analysezwecken und zum Bereitstellen personalisierter Inhalte. Lesen Sie unsere Richtlinien

OK