Saturday 1 April 2017

Arima Moving Average

Prognose - Autoregressive integrierte Moving Average (ARIMA) In diesem Artikel Dieser Service implementiert Autoregressive Integrated Moving Average (ARIMA), um Vorhersagen auf der Grundlage der historischen Daten durch den Benutzer zur Verfügung gestellt. Wird die Nachfrage nach einem bestimmten Produkt in diesem Jahr erhöhen Kann ich meine Produktverkäufe für die Weihnachtszeit vorhersagen, damit ich mein Inventar effektiv planen kann Vorhersagemodelle sind geeignet, solche Fragen anzusprechen. Angesichts der bisherigen Daten untersuchen diese Modelle versteckte Trends und Saisonalität, um zukünftige Trends vorherzusagen. Probieren Sie Azure Machine Learning kostenlos aus Keine Kreditkarten - oder Azure-Abo erforderlich. Erste Schritte gt Dieser Webservice kann von Benutzern potentiell über eine mobile App, über eine Website oder sogar auf einem lokalen Computer verbraucht werden. Aber der Zweck des Web-Service ist auch als Beispiel dafür dienen, wie Azure Machine Learning verwendet werden, um Web-Services auf R-Code zu erstellen. Mit nur wenigen Zeilen von R-Code und Klicks einer Schaltfläche in Azure Machine Learning Studio kann ein Experiment mit R-Code erstellt und als Web-Service veröffentlicht werden. Der Webservice kann dann auf dem Azure Marketplace veröffentlicht und von Benutzern und Geräten auf der ganzen Welt konsumiert werden, ohne dass eine Infrastruktureinrichtung vom Autor des Webdienstes eingerichtet wurde. Verbrauch von Web-Service Dieser Dienst akzeptiert 4 Argumente und berechnet die ARIMA-Prognosen. Die Eingabeargumente sind: Frequenz - Zeigt die Häufigkeit der Rohdaten an (täglich / wöchentlich / monatlich / vierteljährlich / jährlich). Horizont - Zukunft Prognose Zeitrahmen. Datum - Hinzufügen in die neuen Zeitreihendaten für die Zeit. Wert - Hinzufügen in die neuen Zeitreihendatenwerte. Die Ausgabe des Dienstes ist die berechnete Prognosewerte. Beispiel Eingabe könnte sein: Häufigkeit - 12 Horizon - 12 Datum - 1/15/20122/15/20123/15/20124/15/20125/15/20126/15/20127/15/20128/15/20129/15/201210 / 15/201211/15/201212/15/2012 1/15/20132/15/20133/15/20134/15/20135/15/20136 / 15/201311/15/201312/15/2013 1/15/2014/15/20143/15/20144/15/20145/15/20146/15/20147/15/20148/15/20149/15/2014 Wert - 3.4793.683.8323.9413.7973.5863.5083.7313.9153.8443.6343.5493.5573.7853.7823.6013.5443.5563.653.7093.6823.511 3.4293.513.5233.5253.6263.6953.7113.7113.6933.5713.509 Dieser Service, wie auf der Azure Marktplatz gehostet wird, ist ein OData-Dienst diese dürfen Durch POST - oder GET-Methoden aufgerufen werden. Es gibt mehrere Möglichkeiten, den Dienst in einer automatisierten Weise zu verbrauchen (eine Beispiel-App ist hier). Starten des C-Codes für den Web-Service-Verbrauch: Erstellung des Web-Service Dieser Webservice wurde unter Verwendung von Azure Machine Learning erstellt. Für eine kostenlose Testversion sowie Einführungsvideos zum Erstellen von Experimenten und zum Veröffentlichen von Webdiensten. Bitte azurblau / ml. Unten ist ein Screenshot des Experiments, das den Webdienst und den Beispielcode für jedes der Module im Experiment erstellt hat. Aus Azure Machine Learning wurde ein neues Blindversuch erstellt. Beispiel-Eingangsdaten wurden mit einem vordefinierten Datenschema hochgeladen. Verbunden mit dem Datenschema ist ein Execute R Script-Modul, das das ARIMA-Prognosemodell mithilfe von Auto. arima - und Prognosefunktionen aus R erzeugt. Experimentfluss: Einschränkungen Dies ist ein sehr einfaches Beispiel für die ARIMA-Prognose. Wie aus dem obigen Beispielcode ersichtlich ist, ist keine Fehlererfassung implementiert, und der Dienst geht davon aus, dass alle Variablen kontinuierliche / positive Werte sind und die Frequenz eine ganze Zahl größer als 1 sein sollte. Die Länge der Datums - und Wertvektoren sollte sein das Gleiche. Die Datumsvariable sollte dem Format mm / dd / yyyy entsprechen. Häufig gestellte Fragen zum Verbrauch des Webdienstes oder zur Veröffentlichung auf dem Markt finden Sie hier. Allgemeine saisonale ARIMA Modelle: (0,1,1) x (0,1,1) usw. Übersicht der saisonalen ARIMA Modellierung: Der saisonale Teil von Ein ARIMA-Modell hat die gleiche Struktur wie das nicht-saisonale Teil: Es kann einen AR-Faktor, einen MA-Faktor und / oder eine Reihenfolge der Differenzierung haben. Im saisonalen Teil des Modells, alle diese Faktoren arbeiten über Vielfache von Lag s (die Anzahl der Perioden in einer Saison). Eine saisonale ARIMA-Modell wird als ARIMA (p, d, q) x (P, D, Q) Modell eingestuft, wo pNummer saisonaler autoregressive (SAR) Bedingungen, Dnumber saisonaler Unterschiede, Bedingungen Qnumber saisonaler gleitenden Durchschnitt (SMA) Bei der Identifizierung eines saisonalen Modells, ist der erste Schritt, um festzustellen, ob eine saisonale Unterschied erforderlich ist, zusätzlich oder vielleicht statt einer nicht-saisonalen Unterschied. Sie sollten auf Zeitreihenplots und ACF - und PACF-Plots für alle möglichen Kombinationen von 0 oder 1 nicht-saisonalen Unterschied und 0 oder 1 saisonalen Unterschied zu suchen. Achtung: Verwenden Sie nicht mehr als einen saisonalen Unterschied, nicht mehr als zwei Gesamtdifferenzen (saisonal und nicht saisonal kombiniert). Wenn das saisonale Muster sowohl stark und stabil über die Zeit (zB hoch im Sommer und niedrig im Winter, oder umgekehrt) ist, dann sollten Sie wahrscheinlich einen saisonalen Unterschied verwenden, unabhängig davon, ob Sie einen nicht-saisonalen Unterschied verwenden, da dies wird Verhindern, dass das saisonale Muster aus Zerlegung outquot in den langfristigen Prognosen. Fügen Sie diese zu unserer Liste der Regeln für die Identifizierung von Modellen hinzu Regel 12: Wenn die Serie eine starke und konsistente saisonale Muster hat, sollten Sie eine Reihenfolge der saisonalen Differenzierung verwenden - aber nie mehr als eine Reihenfolge der saisonalen Differenzierung oder mehr als 2 verwenden Aufträge der Gesamtdifferenzierung (saisonabhängig). Die Signatur von reinem SAR oder reinem SMA Verhalten ist ähnlich der Signatur von reinem AR oder reinem MA Verhalten, mit der Ausnahme, dass das Muster über Vielfache von Verzögerung s im ACF und PACF auftritt. Beispielsweise hat ein reines SAR (1) - Verfahren Spikes in der ACF bei den Verzögerungen s, 2s, 3s usw., während die PACF nach der Verzögerung s abschaltet. Umgekehrt hat ein reines SMA (1) - Verfahren Spikes in der PACF bei den Verzögerungen s, 2s, 3s usw., während der ACF nach der Verzögerung s abschaltet. Eine SAR-Signatur tritt gewöhnlich auf, wenn die Autokorrelation bei der saisonalen Periode positiv e ist, während eine SMA-Signatur normalerweise auftritt, wenn die saisonale Autokorrelation negativ ist. Daher: Regel 13: Wenn die Autokorrelation bei der Saisonzeit positiv ist. Erwägen, dem Modell einen SAR-Begriff hinzuzufügen. Wenn die Autokorrelation bei der Saisonperiode negativ ist. Erwägen, dem Modell einen SMA-Begriff hinzuzufügen. Vermeiden Sie das Mischen von SAR - und SMA-Begriffen in demselben Modell und vermeiden Sie die Verwendung von mehr als einer der beiden Arten. Normalerweise reicht ein SAR (1) oder SMA (1) Term aus. Sie werden selten eine echte SAR (2) oder SMA (2) Prozess auftreten, und noch mehr haben selten genug Daten 2 oder mehr saisonale Koeffizienten zu schätzen, ohne dass der Schätzalgorithmus in eine quotfeedback loop. quot bekommen zwar eine saisonale ARIMA-Modell zu haben scheint Nur ein paar Parameter, denken Sie daran, dass backforecasting die Schätzung von ein oder zwei Jahreszeiten im Wert von impliziten Parametern, um es zu initialisieren erfordert. Daher sollten Sie mindestens 4 oder 5 Jahreszeiten von Daten, um eine saisonale ARIMA-Modell passen. Das am häufigsten verwendete saisonale ARIMA-Modell ist das (0,1,1) x (0,1,1) - Modell - d. h. Ein MA (1) xSMA (1) - Modell mit einer saisonalen und einer nicht-saisonalen Differenz. Dies ist im wesentlichen ein sequentielles exponentielles Glättungsmodell. Wenn saisonale ARIMA-Modelle an protokollierte Daten angepasst werden, können sie ein multiplikatives saisonales Muster verfolgen. Beispiel: AUTOSALE-Serie erneut besucht Rückruf, dass wir zuvor Prognose der Retail-Auto-Verkaufs-Serie mit einer Kombination aus Deflation, saisonale Anpassung und exponentielle Glättung. Lets jetzt versuchen, passen die gleiche Serie mit saisonalen ARIMA Modelle, mit der gleichen Stichprobe von Daten von Januar 1970 bis Mai 1993 (281 Beobachtungen). Wie vorher werden wir mit deflationierten Autoverkäufen arbeiten - d. H. Wir verwenden die Serie AUTOSALE / CPI als Eingangsgröße. Hier sind die Zeitreihen Grundstück und ACF und PACF Plots der Original-Serie, die durch Auftragen der quotresidualsquot eines ARIMA (0,0,0) x (0,0,0) Modell mit Konstante im Prognoseverfahren erhalten werden: Die Quotsuspension bridgequot Muster in der ACF ist typisch für eine Serie, die sowohl nichtstationäre und stark saisonal ist. Natürlich brauchen wir mindestens eine Ordnung der Differenzierung. Wenn wir eine nicht-saisonale Differenz annehmen, sind die entsprechenden Diagramme wie folgt: Die differenzierte Reihe (die Residuen eines Modells mit wahlfreiem Anstieg) sieht mehr oder weniger stationär aus, aber es gibt immer noch sehr starke Autokorrelation in der Saisonzeit (Verzögerung 12). Weil das saisonale Muster stark und stabil ist, wissen wir (aus Regel 12), dass wir eine Ordnung der saisonalen Differenzierung im Modell verwenden wollen. So sieht das Bild nach einem saisonalen Unterschied aus (nur): Die saisonal differenzierte Serie zeigt ein sehr starkes Muster positiver Autokorrelation, wie wir aus unserem früheren Versuch, ein saisonales Zufallsmodell anzupassen, erinnern. Dies könnte ein Zitat-Signaturquot - oder es könnte signalisieren die Notwendigkeit für einen anderen Unterschied. Wenn wir sowohl einen saisonalen als auch einen nicht-saisonalen Unterschied einnehmen, werden folgende Ergebnisse erzielt: Dies sind natürlich die Residuen aus dem saisonal zufälligen Trendmodell, die wir früher an die Autoverkaufsdaten angepasst haben. Wir sehen jetzt die verräterischen Anzeichen einer leichten Überdifferenzierung. Sind die positiven Spikes in der ACF und PACF negativ geworden. Was ist die richtige Reihenfolge der Differenzierung Eine weitere Information, die hilfreich sein könnte, ist eine Berechnung der Fehlerstatistik der Serie auf jeder Ebene der Differenzierung. Wir können diese berechnen, indem wir die entsprechenden ARIMA-Modelle, in denen nur differencing verwendet wird, berechnen: Die kleinsten Fehler, sowohl in der Schätzperiode als auch in der Validierungsperiode, werden durch Modell A erhalten, das eine Differenz von jedem Typ verwendet. Dies, zusammen mit dem Auftreten der Plots oben, deutet stark darauf hin, dass wir sowohl eine saisonale und eine nonsaisonale Unterschied verwenden sollten. Das Modell A ist das saisonale Zufalls-Trend-Modell (SRT-Modell), während das Modell B nur das saisonal zufällige (SRW) Modell darstellt. Wie wir bereits beim Vergleich dieser Modelle festgestellt haben, scheint das SRT-Modell besser zu passen als das SRW-Modell. In der Analyse, die folgt, werden wir versuchen, diese Modelle durch die Zugabe von saisonalen ARIMA Bedingungen zu verbessern. Zurück zum Seitenanfang. Das häufig verwendete ARIMA (0,1,1) x (0,1,1) Modell: SRT Modell plus MA (1) und SMA (1) Begriffe Rückkehr zum letzten Satz von Plots oben, bemerken, dass mit einer Differenz von Jede Art gibt es eine negative Spitze in der ACF bei Verzögerung 1 und auch eine negative Spitze in der ACF bei Verzögerung 12. Wohingegen die PACF in der Nähe dieser beiden Verzögerungen ein graduelleres quadratisches Muster zeigt. Durch die Anwendung unserer Regeln zur Identifizierung von ARIMA-Modellen (speziell Regel 7 und Regel 13) können wir nun folgern, dass das SRT-Modell durch den Zusatz eines MA (1) - Terms und auch eines SMA (1) - Terms verbessert wird. Auch nach Regel 5 schließen wir die Konstante aus, da zwei Befehlsordnungen beteiligt sind. Wenn wir dies alles tun, erhalten wir das ARIMA (0,1,1) x (0,1,1) Modell. Welches das am häufigsten verwendete saisonale ARIMA-Modell ist. Seine Prognose-Gleichung ist: wobei 952 1 der MA (1) - Koeffizient und 920 1 (Kapital-Theta-1) der SMA (1) - Koeffizient ist. Man beachte, daß der Koeffizient des Lag-13-Fehlers das Produkt des MA (1) und des MA-1 ist SMA (1) Koeffizienten. Dieses Modell ist konzeptionell dem Winters-Modell insofern ähnlich, als es die exponentielle Glättung effektiv auf Niveau, Trend und Saisonalität auf einmal anwendet, obwohl es auf fundierteren theoretischen Grundlagen beruht, insbesondere im Hinblick auf die Berechnung von Konfidenzintervallen für Langzeitprognosen. Seine Residualplots sind in diesem Fall wie folgt: Obwohl eine geringe Autokorrelation bei der Verzögerung 12 verbleibt, ist das Gesamtaussehen der Diagramme gut. Die Modellanpassungsergebnisse zeigen, dass die geschätzten MA (1) - und SMA (1) - Koeffizienten (die nach 7 Iterationen erhalten wurden) tatsächlich signifikant sind: Die Prognosen des Modells ähneln denen des saisonalen Zufallsmodells - d. h. Sie nehmen das saisonale Muster und den lokalen Trend am Ende der Serie auf - aber sie sind etwas glatter im Aussehen, da sowohl das saisonale Muster als auch der Trend in der letzten Zeit effektiv gemittelt werden (in einer exponentiell-glatten Art) Einige Jahreszeiten: Was ist dieses Modell wirklich tun Sie können es auf die folgende Weise denken. Zuerst berechnet er die Differenz zwischen jedem Monat8217s-Wert und einem 8220exponentiell gewichteten historischen Durchschnitt8221 für diesen Monat, der berechnet wird, indem exponentielle Glättung auf Werte angewendet wird, die im selben Monat in früheren Jahren beobachtet wurden, wobei der Betrag der Glättung durch die SMA bestimmt wird (1 ) - Koeffizient. Dann wird eine einfache exponentielle Glättung auf diese Unterschiede angewandt, um die Abweichung von dem historischen Durchschnitt vorherzusagen, der im nächsten Monat beobachtet wird. Der Wert des SMA (1) - Koeffizienten in der Nähe von 1,0 legt nahe, dass viele Jahreszeiten von Daten verwendet werden, um den historischen Durchschnitt für einen bestimmten Monat des Jahres zu berechnen. Es sei daran erinnert, dass ein MA (1) - Koeffizient in einem ARIMA-Modell (0,1,1) 1-minus-alpha in dem entsprechenden exponentiellen Glättungsmodell entspricht und dass das Durchschnittsalter der Daten in einer exponentiellen Glättungsmodellprognose 1 / Alpha. Der SMA (1) - Koeffizient hat eine ähnliche Interpretation in Bezug auf Durchschnittswerte über die Jahreszeiten. Der Wert von 0,91 deutet darauf hin, dass das Durchschnittsalter der für die Schätzung des historischen Saisonmusters verwendeten Daten etwas mehr als 10 Jahre beträgt (fast die Hälfte der Länge des Datensatzes), was bedeutet, dass ein fast konstantes Jahreszeitmuster angenommen wird. Der viel kleinere Wert von 0,5 für den MA (1) - Koeffizienten deutet darauf hin, dass relativ wenig Glättung durchgeführt wird, um die aktuelle Abweichung von dem historischen Durchschnitt für denselben Monat abzuschätzen, sodass der nächste Monat8217s vorhergesagte Abweichung von seinem historischen Durchschnitt in der Nähe der Abweichungen liegt Aus dem historischen Durchschnitt, die in den letzten Monaten beobachtet wurden. Das Modell ARIMA (1,0,0) x (0,1,0) mit konstantem SRW-Modell und AR (1) - Zustand Das Vorgängermodell war ein saisonales Random-Trend-Modell (SRT) 1) und SMA (1) Koeffizienten. Ein alternatives ARIMA-Modell für diese Serie kann erhalten werden, indem ein AR (1) - Term für die nicht-saisonale Differenz - d. h. Durch Hinzufügen eines AR (1) - Terms zu dem Seasonal Random Walk (SRW) - Modell. Dies ermöglicht es uns, das saisonale Muster in dem Modell zu bewahren, während der Gesamtbetrag der Differenzierung gesenkt wird, wodurch die Stabilität der Trendvorsprünge erhöht wird, wenn dies gewünscht wird. (Erinnern wir uns, dass die Reihe mit einer saisonalen Differenz alleine eine starke AR (1) Signatur zeigte.) Wenn wir dies tun, erhalten wir ein ARIMA (1,0,0) x (0,1,0) Modell mit konstanten, Was zu folgenden Ergebnissen führt: Der AR (1) - Koeffizient ist tatsächlich sehr signifikant und der RMSE ist nur 2,06, verglichen mit 3,00 für das SRW-Modell (Modell B im obigen Vergleichsbericht). Die Prognose-Gleichung für dieses Modell ist: Der zusätzliche Begriff auf der rechten Seite ist ein Vielfaches des saisonalen Unterschieds, der im letzten Monat beobachtet wurde, was die Wirkung hat, die Prognose für die Wirkung eines ungewöhnlich guten oder schlechten Jahres zu korrigieren. Dabei bezeichnet 981 1 den AR (1) - Koeffizienten, dessen Schätzwert 0,73 ist. So zum Beispiel, wenn Verkäufe letzter Monat waren X Dollar vor Verkäufen ein Jahr früher, dann die Quantität 0.73X würde die Prognose für diesen Monat hinzugefügt werden. 956 bezeichnet die Konstante in der Prognosegleichung, deren Schätzwert 0,20 beträgt. Die geschätzte MEAN, deren Wert 0,75 ist, ist der Mittelwert der saisonal differenzierten Serien, was der jährliche Trend bei den Langzeitprognosen dieses Modells ist. Die Konstante ist (durch Definition) gleich den mittleren Zeiten 1 minus dem AR (1) - Koeffizienten: 0,2 0,75 (1 8211 0,73). Die Prognose zeigt, dass das Modell in der Tat eine bessere Arbeit als das SRW-Modell der Verfolgung zyklischer Veränderungen (dh ungewöhnlich gute oder schlechte Jahre): Aber die MSE für dieses Modell ist noch deutlich größer als das, was wir für die ARIMA (0, 1,1) x (0,1,1) - Modell. Wenn wir uns die Grundstücke der Residuen anschauen, sehen wir Raum für Verbesserungen. Die Residuen zeigen immer noch ein Zeichen der zyklischen Variation: Die ACF und PACF legen nahe, dass sowohl MA (1) als auch SMA (1) Koeffizienten benötigt werden: Eine verbesserte Version: ARIMA (1,0,1) x (0,1,1) Mit Konstanten Wenn wir die angezeigten MA (1) und SMA (1) Terme dem vorhergehenden Modell hinzufügen, erhalten wir ein ARIMA (1,0,1) x (0,1,1) Modell mit einer Konstante, deren Prognosegleichung Dies ist Ist fast das gleiche wie das ARIMA (0,1,1) x (0,1,1) - Modell, mit der Ausnahme, dass es die nicht-saisonale Differenz durch einen AR (1) - Term ersetzt (eine partielle Differentialquot) und einen konstanten Term enthält, Langfristigen Trend. Daher nimmt dieses Modell einen stabileren Trend an als das ARIMA (0,1,1) x (0,1,1) - Modell, und das ist der Hauptunterschied zwischen ihnen. Die Modell-Anpassungsergebnisse sind wie folgt: Beachten Sie, dass der geschätzte AR (1) - Koeffizient (981 1 in der Modellgleichung) 0,96 ist, der sehr nahe bei 1,0 liegt, aber nicht so nahe ist, dass er unbedingt ersetzt werden sollte Ein erster Unterschied: sein Standardfehler ist 0.02, also ist er ungefähr 2 Standardfehler von 1.0. Die anderen Statistiken des Modells (die geschätzten MA (1) - und SMA (1) - Koeffizienten und Fehlerstatistiken in den Schätz - und Validierungsperioden sind ansonsten mit denen des ARIMA (0,1,1) x (0,1 , 1) - Modell. (Die geschätzten MA (1) und SMA (1) Koeffizienten sind 0,45 und 0,91 in diesem Modell gegenüber 0,48 und 0,91 in der anderen.) Die geschätzte MEAN von 0,68 ist der vorhergesagte langfristige Trend (durchschnittliche jährliche Steigerung). Dies ist im wesentlichen der gleiche Wert, der im (1,0,0) x (0,1,0) - mit konstanten Modell erhalten wurde. Der Standardfehler des geschätzten Mittels ist 0,26, so dass die Differenz zwischen 0,75 und 0,68 nicht signifikant ist. Wenn die Konstante nicht in diesem Modell enthalten wäre, wäre es ein gedämpftes Trendmodell: Der Trend in seinen sehr langfristigen Prognosen würde allmählich abflachen. Die Punktvorhersagen aus diesem Modell ähneln denen des (0,1,1) x (0,1,1) - Modells, da der durchschnittliche Trend dem lokalen Trend am Ende der Serie ähnlich ist. Allerdings wachsen die Konfidenzintervalle für dieses Modell etwas weniger schnell aufgrund seiner Annahme, dass der Trend stabil ist. Beachten Sie, dass die Vertrauensgrenzen für die zweijährigen Prognosen nun innerhalb der horizontalen Rasterlinien bei 24 und 44 bleiben, während die Werte des (0,1,1) x (0,1,1) Modells nicht: saisonale ARIMA Versus exponentielle Glättung und saisonale Anpassung: Jetzt können wir die Leistung der beiden besten ARIMA - Modelle mit einfachen und linearen exponentiellen Glättungsmodellen vergleichen, begleitet von einer multiplikativen saisonalen Anpassung und dem Winters - Modell, wie in den Dias zur Prognose mit saisonaler Anpassung dargestellt: Sind die Ein-Perioden-Prognosen für alle Modelle in diesem Fall extrem eng. Es ist schwierig, eine 8220winner8221 basierend auf diesen Zahlen allein auszuwählen. Zurück zum Seitenanfang. Was sind die Kompromisse zwischen den verschiedenen saisonalen Modellen Die drei Modelle, die multiplikative saisonale Anpassung verwenden Deal mit Saisonalität in einer expliziten Weise - d. H. Saisonale Indizes werden als expliziter Teil des Modells ausgebrochen. Die ARIMA-Modelle behandeln Saisonalität in einer impliziteren Weise - wir können nicht leicht sehen, in der ARIMA-Ausgabe, wie die durchschnittliche Dezember, sagen, unterscheidet sich von der durchschnittlichen Juli. Abhängig davon, ob es wichtig ist, das saisonale Muster zu isolieren, könnte dies ein Faktor bei der Auswahl unter den Modellen sein. Die ARIMA-Modelle haben den Vorteil, dass sie, sobald sie initialisiert worden sind, weniger bewegliche Teile als die exponentiellen Glättungs - und Einstellmodelle haben und daher weniger wahrscheinlich sind, die Daten zu überladen. ARIMA Modelle haben auch eine solide zugrundeliegende Theorie in Bezug auf die Berechnung der Konfidenzintervalle für längerfristige Prognosen als die anderen Modelle. Es gibt mehr dramatische Unterschiede zwischen den Modellen in Bezug auf das Verhalten ihrer Prognosen und Konfidenzintervalle für Prognosen mehr als 1 Zeitraum in die Zukunft. Dies ist, wo die Annahmen, die in Bezug auf Veränderungen in der Trend-und saisonale Muster sind sehr wichtig. Zwischen den beiden ARIMA-Modellen schätzt eine (Modell A) einen zeitlichen Trend, während die andere (Modell B) einen langfristigen durchschnittlichen Trend aufweist. (Wir könnten, falls gewünscht, den langfristigen Trend im Modell B durch Unterdrücken des konstanten Terms abflachen.) Unter den exponentiellen Glättungs-plus-Anpassungsmodellen nimmt ein Modell C einen flachen Trend an, während das andere ( Modell D) einen zeitlich variierenden Trend. Das Winters-Modell (E) nimmt auch einen zeitlichen Trend an. Modelle, die einen konstanten Trend annehmen, sind in ihren Langzeitprognosen relativ zuversichtlicher als Modelle, die dies nicht tun, und dies wird sich in der Regel auch in dem Ausmaß widerspiegeln, in dem Vertrauensintervalle für Prognosen bei längeren Prognosehorizonten breiter werden. Modelle, die keine zeitvariablen Trends voraussetzen, haben im Allgemeinen schmalere Konfidenzintervalle für längerfristige Prognosen, aber schmaler ist es nicht, wenn diese Annahme nicht korrekt ist. Die beiden exponentiellen Glättungsmodelle in Verbindung mit saisonaler Anpassung gehen davon aus, dass das saisonale Muster während der 23 Jahre in der Datenstichprobe konstant geblieben ist, während die anderen drei Modelle dies nicht tun. Soweit die saisonale Muster für die meisten der Monat-zu-Monat-Variation in den Daten verantwortlich ist, ist es richtig für die Prognose, was wird mehrere Monate in die Zukunft geschehen. Wenn das saisonale Muster vermutlich sich im Laufe der Zeit langsam verändert hat, wäre ein anderer Ansatz, nur eine kürzere Datenhistorie für die Anpassung der Modelle zu verwenden, die feste Saisonindizes abschätzen. Für die Aufzeichnung sind hier die Prognosen und 95 Konfidenzgrenzen für Mai 1995 (24 Monate voraus), die von den fünf Modellen erzeugt werden: Die Punktprognosen sind tatsächlich überraschend nahe beieinander, bezogen auf die Breiten aller Konfidenzintervalle. Die SES-Punktvorhersage ist am niedrigsten, weil sie das einzige Modell ist, das am Ende der Serie keinen Aufwärtstrend annimmt. Das Modell ARIMA (1,0,1) x (0,1,1) c hat die engsten Konfidenzgrenzen, da es weniger zeitliche Variation in den Parametern annimmt als die anderen Modelle. Auch die Punktprognose ist etwas größer als die der anderen Modelle, da sie einen langfristigen Trend und nicht einen kurzfristigen Trend (oder Null-Trend) extrapoliert. Das Winters-Modell ist das am wenigsten stabile Modell der Modelle, und seine Prognose weist daher die breitesten Vertrauensgrenzen auf, wie sich aus den detaillierten Prognoseplänen für die Modelle ergab. Und die Prognosen und Vertrauensgrenzen des Modells ARIMA (0,1,1) x (0,1,1) und denen des LESseasonal-Anpassungsmodells sind praktisch identisch. Loggen oder nicht protokollieren Etwas, was wir noch nicht getan haben, aber Haben könnte, ist eine Log-Transformation als Teil des Modells enthalten. Saisonale ARIMA-Modelle sind von Natur aus additive Modelle, also, wenn wir ein multiplikatives saisonales Muster erfassen wollen. Müssen wir dies tun, indem wir die Daten vor dem Einbau des ARIMA-Modells protokollieren. (In Statgraphics müssten wir nur den "Natural Logquot" als Modellierungsoption angeben - keine große Sache.) In diesem Fall scheint die Deflationstransformation eine zufriedenstellende Aufgabe zu haben, die Amplituden der Saisonzyklen zu stabilisieren Scheint ein zwingender Grund zu sein, eine Protokolltransformation hinzuzufügen, soweit es sich um langfristige Trends handelt. Wenn die Residuen eine deutliche Zunahme der Varianz im Laufe der Zeit zeigten, könnten wir anders entscheiden. Es gibt noch eine Frage, ob die Fehler dieser Modelle eine konsistente Varianz über Monate des Jahres haben. Wenn sie don8217t, dann Konfidenzintervalle für Prognosen können dazu neigen, zu breit oder zu schmal nach der Saison. Die Residual-vs-Zeit-Diagramme zeigen in dieser Hinsicht kein offensichtliches Problem, aber um gründlich zu sein, wäre es gut, die Fehlerabweichung pro Monat zu betrachten. Wenn es tatsächlich ein Problem, eine Protokoll-Transformation könnte es zu beheben. Zurück zum Anfang der Seite.2.1 Verschieben von Durchschnittsmodellen (MA-Modelle) Zeitreihenmodelle, die als ARIMA-Modelle bekannt sind, können autoregressive Begriffe und / oder gleitende Durchschnittsterme enthalten. In Woche 1 erlernten wir einen autoregressiven Term in einem Zeitreihenmodell für die Variable x t ist ein verzögerter Wert von x t. Beispielsweise ist ein autoregressiver Term der Verzögerung 1 x t-1 (multipliziert mit einem Koeffizienten). Diese Lektion definiert gleitende Durchschnittsterme. Ein gleitender Durchschnittsterm in einem Zeitreihenmodell ist ein vergangener Fehler (multipliziert mit einem Koeffizienten). Es sei n (0, sigma2w) überschritten, was bedeutet, daß die wt identisch unabhängig voneinander verteilt sind, jeweils mit einer Normalverteilung mit dem Mittelwert 0 und der gleichen Varianz. Das durch MA (1) bezeichnete gleitende Durchschnittsmodell der 1. Ordnung ist (xt mu wt theta1w) Das durch MA (2) bezeichnete gleitende Durchschnittsmodell der zweiten Ordnung ist (xt mu wt theta1w theta2w) Das gleitende Mittelmodell der q-ten Ordnung , Mit MA (q) bezeichnet, ist (xt mu wt theta1w theta2w dots thetaqw) Hinweis. Viele Lehrbücher und Softwareprogramme definieren das Modell mit negativen Vorzeichen vor den Begriffen. Dies ändert nicht die allgemeinen theoretischen Eigenschaften des Modells, obwohl es die algebraischen Zeichen der geschätzten Koeffizientenwerte und (nicht quadrierten) Ausdrücke in Formeln für ACFs und Abweichungen umwandelt. Sie müssen Ihre Software überprüfen, um zu überprüfen, ob negative oder positive Vorzeichen verwendet worden sind, um das geschätzte Modell korrekt zu schreiben. R verwendet positive Vorzeichen in seinem zugrunde liegenden Modell, wie wir hier tun. Theoretische Eigenschaften einer Zeitreihe mit einem MA (1) Modell Beachten Sie, dass der einzige Wert ungleich Null im theoretischen ACF für Verzögerung 1 ist. Alle anderen Autokorrelationen sind 0. Somit ist ein Proben-ACF mit einer signifikanten Autokorrelation nur bei Verzögerung 1 ein Indikator für ein mögliches MA (1) - Modell. Für interessierte Studierende, Beweise dieser Eigenschaften sind ein Anhang zu diesem Handout. Beispiel 1 Angenommen, dass ein MA (1) - Modell x t 10 w t .7 w t-1 ist. Wobei (wt overset N (0,1)). Somit ist der Koeffizient 1 0,7. Die theoretische ACF wird durch eine Plot dieser ACF folgt folgt. Die graphische Darstellung ist die theoretische ACF für eine MA (1) mit 1 0,7. In der Praxis liefert eine Probe gewöhnlich ein solches klares Muster. Unter Verwendung von R simulierten wir n 100 Abtastwerte unter Verwendung des Modells x t 10 w t .7 w t-1, wobei w t iid N (0,1) war. Für diese Simulation folgt ein Zeitreihen-Diagramm der Probendaten. Wir können nicht viel von dieser Handlung erzählen. Die Proben-ACF für die simulierten Daten folgt. Wir sehen eine Spitze bei Verzögerung 1, gefolgt von im Allgemeinen nicht signifikanten Werten für Verzögerungen nach 1. Es ist zu beachten, dass das Beispiel-ACF nicht mit dem theoretischen Muster des zugrunde liegenden MA (1) übereinstimmt, was bedeutet, dass alle Autokorrelationen für Verzögerungen nach 1 0 sein werden Eine andere Probe hätte eine geringfügig unterschiedliche Probe ACF wie unten gezeigt, hätte aber wahrscheinlich die gleichen breiten Merkmale. Theroretische Eigenschaften einer Zeitreihe mit einem MA (2) - Modell Für das MA (2) - Modell sind die theoretischen Eigenschaften die folgenden: Die einzigen Werte ungleich Null im theoretischen ACF sind für die Lags 1 und 2. Autokorrelationen für höhere Lags sind 0 , So zeigt ein Beispiel-ACF mit signifikanten Autokorrelationen bei Lags 1 und 2, aber nicht signifikante Autokorrelationen für höhere Lags ein mögliches MA (2) - Modell. Iid N (0,1). Die Koeffizienten betragen 1 0,5 und 2 0,3. Da es sich hierbei um ein MA (2) handelt, wird der theoretische ACF nur bei den Verzögerungen 1 und 2 Werte ungleich Null aufweisen. Werte der beiden Nicht-Autokorrelationen sind A-Plots des theoretischen ACFs. Wie fast immer der Fall ist, verhalten sich Musterdaten nicht ganz so perfekt wie die Theorie. Wir simulierten n 150 Beispielwerte für das Modell x t 10 w t .5 w t-1 .3 w t-2. Wobei wt iid N (0,1) ist. Die Zeitreihenfolge der Daten folgt. Wie bei dem Zeitreihenplot für die MA (1) Beispieldaten können Sie nicht viel davon erzählen. Die Proben-ACF für die simulierten Daten folgt. Das Muster ist typisch für Situationen, in denen ein MA (2) - Modell nützlich sein kann. Es gibt zwei statistisch signifikante Spikes bei Lags 1 und 2, gefolgt von nicht signifikanten Werten für andere Lags. Beachten Sie, dass aufgrund des Stichprobenfehlers das Muster ACF nicht genau dem theoretischen Muster entsprach. ACF für allgemeine MA (q) - Modelle Eine Eigenschaft von MA (q) - Modellen besteht im Allgemeinen darin, dass Autokorrelationen ungleich Null für die ersten q-Verzögerungen und Autokorrelationen 0 für alle Verzögerungen gt q existieren. Nicht-Eindeutigkeit der Verbindung zwischen Werten von 1 und (rho1) in MA (1) Modell. Im MA (1) - Modell für einen Wert von 1. Die reziproke 1/1 gibt den gleichen Wert für Als Beispiel, verwenden Sie 0.5 für 1. Und dann 1 / (0,5) 2 für 1 verwenden. Youll erhalten (rho1) 0,4 in beiden Fällen. Um eine theoretische Einschränkung als Invertibilität zu befriedigen. Wir beschränken MA (1) - Modelle auf Werte mit einem Absolutwert von weniger als 1. In dem gerade angegebenen Beispiel ist 1 0,5 ein zulässiger Parameterwert, während 1 1 / 0,5 2 nicht. Invertibilität von MA-Modellen Ein MA-Modell soll invertierbar sein, wenn es algebraisch äquivalent zu einem konvergierenden unendlichen Ordnungs-AR-Modell ist. Durch Konvergenz meinen wir, dass die AR-Koeffizienten auf 0 sinken, wenn wir in der Zeit zurückgehen. Invertibilität ist eine Einschränkung, die in Zeitreihensoftware programmiert ist, die verwendet wird, um die Koeffizienten von Modellen mit MA-Begriffen abzuschätzen. Sein nicht etwas, das wir in der Datenanalyse überprüfen. Zusätzliche Informationen über die Invertibilitätsbeschränkung für MA (1) - Modelle finden Sie im Anhang. Fortgeschrittene Theorie Anmerkung. Für ein MA (q) - Modell mit einem angegebenen ACF gibt es nur ein invertierbares Modell. Die notwendige Bedingung für die Invertierbarkeit ist, daß die Koeffizienten solche Werte haben, daß die Gleichung 1- 1 y-. - q y q 0 hat Lösungen für y, die außerhalb des Einheitskreises liegen. R-Code für die Beispiele In Beispiel 1 wurde der theoretische ACF des Modells x t 10 w t aufgetragen. 7w t-1. Und dann n 150 Werte aus diesem Modell simuliert und die Abtastzeitreihen und die Abtast-ACF für die simulierten Daten aufgetragen. Die R-Befehle, die verwendet wurden, um den theoretischen ACF aufzuzeichnen, waren: acfma1ARMAacf (mac (0,7), lag. max10) 10 Verzögerungen von ACF für MA (1) mit theta1 0,7 lags0: 10 erzeugt eine Variable namens lags, die im Bereich von 0 bis 10 liegt (H0) fügt dem Diagramm eine horizontale Achse hinzu Der erste Befehl bestimmt den ACF und speichert ihn in einem Objekt Genannt acfma1 (unsere Wahl des Namens). Der Plotbefehl (der dritte Befehl) verläuft gegen die ACF-Werte für die Verzögerungen 1 bis 10. Der ylab-Parameter bezeichnet die y-Achse und der Hauptparameter einen Titel auf dem Plot. Um die Zahlenwerte der ACF zu sehen, benutzen Sie einfach den Befehl acfma1. Die Simulation und Diagramme wurden mit den folgenden Befehlen durchgeführt. (N150, list (mac (0.7))) Simuliert n 150 Werte aus MA (1) xxc10 addiert 10 zum Mittelwert 10. Simulationsvorgaben bedeuten 0. plot (x, typeb, mainSimulated MA (1) data) Acf (x, xlimc (1,10), mainACF für simulierte Probendaten) In Beispiel 2 wurde der theoretische ACF des Modells xt 10 wt. 5 w t-1 .3 w t-2 aufgetragen. Und dann n 150 Werte aus diesem Modell simuliert und die Abtastzeitreihen und die Abtast-ACF für die simulierten Daten aufgetragen. Die verwendeten R-Befehle waren acfma2ARMAacf (mac (0,5,0,3), lag. max10) acfma2 lags0: 10 Plot (lags, acfma2, xlimc (1,10), ylabr, typh, main ACF für MA (2) mit theta1 0,5, (X, x) (x, x) (x, x, x, y) (1) Für interessierte Studierende sind hier Beweise für die theoretischen Eigenschaften des MA (1) - Modells. Variante: (Text (xt) Text (mu wt theta1 w) 0 Text (wt) Text (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Wenn h 1 der vorhergehende Ausdruck 1 w 2. Für irgendeinen h 2 ist der vorhergehende Ausdruck 0 Der Grund dafür ist, dass, durch Definition der Unabhängigkeit der wt. E (w k w j) 0 für beliebige k j. Da w w die Mittelwerte 0, E (w j w j) E (w j 2) w 2 haben. Für eine Zeitreihe, Wenden Sie dieses Ergebnis an, um den oben angegebenen ACF zu erhalten. Ein invertierbares MA-Modell ist eines, das als unendliches Ordnungs-AR-Modell geschrieben werden kann, das konvergiert, so daß die AR-Koeffizienten gegen 0 konvergieren, wenn wir unendlich zurück in der Zeit bewegen. Gut zeigen Invertibilität für die MA (1) - Modell. Dann setzen wir die Beziehung (2) für wt-1 in Gleichung (1) (3) ein (zt wt theta1 (z-therma1w) wt theta1z - theta2w) Zum Zeitpunkt t-2. Gleichung (2) wird dann in Gleichung (3) die Gleichung (4) für wt-2 ersetzen (zt wt theta1 z - theta21w wt theta1z - theta21 (z - theta1w) wt theta1z - theta12z theta31w) Unendlich), erhalten wir das unendliche Ordnungsmodell (zt wt theta1 z - theta21z theta31z - theta41z Punkte) Beachten Sie jedoch, dass bei 1 1 die Koeffizienten, die die Verzögerungen von z vervielfachen (unendlich) in der Größe zunehmen, Zeit. Um dies zu verhindern, benötigen wir 1 lt1. Dies ist die Bedingung für ein invertierbares MA (1) - Modell. Unendlich Ordnung MA Modell In Woche 3, gut sehen, dass ein AR (1) Modell in ein unendliches order MA Modell umgewandelt werden kann: (xt - mu wt phi1w phi21w Punkte phik1 w Punkte sum phij1w) Diese Summation der Vergangenheit weißer Rauschbegriffe ist bekannt Als die kausale Darstellung eines AR (1). Mit anderen Worten, x t ist eine spezielle Art von MA mit einer unendlichen Anzahl von Begriffen, die in der Zeit zurückgehen. Dies wird als unendliche Ordnung MA oder MA () bezeichnet. Eine endliche Ordnung MA ist eine unendliche Ordnung AR und jede endliche Ordnung AR ist eine unendliche Ordnung MA. Rückruf in Woche 1, stellten wir fest, dass eine Anforderung für eine stationäre AR (1) ist, dass 1 lt1. Berechnen Sie die Var (x t) mit der kausalen Darstellung. Dieser letzte Schritt verwendet eine grundlegende Tatsache über geometrische Reihen, die (phi1lt1) erfordert, andernfalls divergiert die Reihe. Navigation


No comments:

Post a Comment