Es gibt eine Reihe von Ansätzen zur Modellierung von Zeitreihen. Wir skizzieren einige der häufigsten Ansätze unten. Trend, saisonale, restliche Zerlegungen Ein Ansatz besteht darin, die Zeitreihe in eine Trend-, Saison - und Restkomponente zu zerlegen. Eine dreifache exponentielle Glättung ist ein Beispiel für diesen Ansatz. Ein anderes Beispiel, genannt saisonale Löss, basiert auf lokal gewichteten kleinsten Quadraten und wird von Cleveland (1993) diskutiert. Wir sprechen nicht über jahreszeitlichen Löss in diesem Handbuch. Häufigkeit basierte Methoden Ein weiterer Ansatz, der üblicherweise in wissenschaftlichen und technischen Anwendungen verwendet wird, besteht darin, die Serie im Frequenzbereich zu analysieren. Ein Beispiel für diesen Ansatz bei der Modellierung eines sinusförmigen Typs Datensatz ist in der Strahlablenkung Fallstudie gezeigt. Die spektrale Darstellung ist das primäre Werkzeug für die Frequenzanalyse von Zeitreihen. Autoregressive (AR) - Modelle Ein gemeinsamer Ansatz zur Modellierung univariater Zeitreihen ist das autoregressive (AR) Modell: Xt delta phi1 X phi2 X cdots phip X At, wobei (Xt) die Zeitreihe ist (At) ist weißes Rauschen und Delta Links (1 - sum p phii rechts) mu. Mit (mu) den Prozessmittel bedeuten. Ein autoregressives Modell ist einfach eine lineare Regression des aktuellen Wertes der Serie gegen einen oder mehrere vorherige Werte der Serie. Der Wert von (p) heißt die Reihenfolge des AR-Modells. AR-Modelle können mit einer von verschiedenen Methoden analysiert werden, einschließlich standardmäßiger linearer Quadrate-Techniken. Sie haben auch eine einfache Interpretation. Moving Average (MA) Modelle Ein weiterer gemeinsamer Ansatz zur Modellierung univariater Zeitreihenmodelle ist das gleitende Mittelwert (MA) Modell: Xt mu At - theta1 A - theta2 A - cdots - thetaq A, wobei (Xt) die Zeitreihe ist (mu ) Ist der Mittelwert der Reihe, (A) sind weiße Rauschbegriffe, und (theta1, ldots, thetaq) sind die Parameter des Modells. Der Wert von (q) heißt die Reihenfolge des MA-Modells. Das heißt, ein gleitender Durchschnittsmodell ist konzeptionell eine lineare Regression des aktuellen Wertes der Reihe gegen das weiße Rauschen oder zufällige Schocks eines oder mehrerer vorheriger Werte der Reihe. Die zufälligen Schocks an jedem Punkt werden von der gleichen Verteilung, typischerweise einer Normalverteilung, mit der Position bei Null und konstantem Maßstab angenommen. Die Unterscheidung in diesem Modell ist, dass diese zufälligen Schocks zu zukünftigen Werten der Zeitreihen übertragen werden. Die Anpassung der MA-Schätzungen ist komplizierter als bei AR-Modellen, da die Fehlerterme nicht beobachtbar sind. Dies bedeutet, dass iterative nichtlineare Anpassungsverfahren anstelle von linearen kleinsten Quadraten verwendet werden müssen. MA-Modelle haben auch eine weniger offensichtliche Interpretation als AR-Modelle. Manchmal wird das ACF und PACF darauf hindeuten, dass ein MA-Modell eine bessere Modellwahl wäre und manchmal auch AR - und MA-Begriffe im selben Modell verwendet werden sollten (siehe Abschnitt 6.4.4.5). Beachten Sie jedoch, dass die Fehlertermine nach dem Modell unabhängig sind und den Standardannahmen für einen univariaten Prozess folgen. Box und Jenkins popularisierten einen Ansatz, der den gleitenden Durchschnitt und die autoregressiven Ansätze in dem Buch Time Series Analysis: Prognose und Kontrolle (Box, Jenkins und Reinsel, 1994) kombiniert. Obwohl sowohl autoregressive als auch gleitende durchschnittliche Ansätze bereits bekannt waren (und ursprünglich von Yule untersucht wurden), war der Beitrag von Box und Jenkins in der Entwicklung einer systematischen Methodik zur Identifizierung und Schätzung von Modellen, die beide Ansätze beinhalten könnten. Das macht Box-Jenkins Modelle zu einer leistungsstarken Klasse von Modellen. Die nächsten paar Abschnitte werden diese Modelle im Detail besprechen. Einleitung zu ARIMA: Nichtseasonal-Modelle ARIMA (p, d, q) Prognosegleichung: ARIMA-Modelle sind in der Theorie die allgemeinste Klasse von Modellen zur Vorhersage einer Zeitreihe, die gemacht werden kann Zu 8220stationary8221 durch Differenzierung (falls erforderlich), vielleicht in Verbindung mit nichtlinearen Transformationen wie Logging oder Deflating (falls nötig). Eine zufällige Variable, die eine Zeitreihe ist, ist stationär, wenn ihre statistischen Eigenschaften alle über die Zeit konstant sind. Eine stationäre Serie hat keinen Trend, ihre Variationen um ihre Mittel haben eine konstante Amplitude, und es wackelt in einer konsistenten Weise. D. h. seine kurzzeitigen zufälligen Zeitmuster sehen immer in einem statistischen Sinn gleich aus. Die letztere Bedingung bedeutet, daß ihre Autokorrelationen (Korrelationen mit ihren eigenen vorherigen Abweichungen vom Mittelwert) über die Zeit konstant bleiben oder äquivalent, daß sein Leistungsspektrum über die Zeit konstant bleibt. Eine zufällige Variable dieses Formulars kann (wie üblich) als eine Kombination von Signal und Rauschen betrachtet werden, und das Signal (wenn man offensichtlich ist) könnte ein Muster der schnellen oder langsamen mittleren Reversion oder sinusförmigen Oszillation oder eines schnellen Wechsels im Zeichen sein , Und es könnte auch eine saisonale Komponente haben. Ein ARIMA-Modell kann als 8220filter8221 betrachtet werden, das versucht, das Signal vom Rauschen zu trennen, und das Signal wird dann in die Zukunft extrapoliert, um Prognosen zu erhalten. Die ARIMA-Prognosegleichung für eine stationäre Zeitreihe ist eine lineare (d. h. regressionstypische) Gleichung, bei der die Prädiktoren aus Verzögerungen der abhängigen Variablen und Verzögerungen der Prognosefehler bestehen. Das heißt: vorhergesagter Wert von Y eine Konstante undeiner gewichteten Summe von einem oder mehreren neueren Werten von Y und einer gewichteten Summe von einem oder mehreren neueren Werten der Fehler. Wenn die Prädiktoren nur aus verzögerten Werten von Y bestehen, ist es ein reines autoregressives Modell (8220 selbst-regressed8221), das nur ein Spezialfall eines Regressionsmodells ist und mit Standardregressionssoftware ausgestattet werden kann. Zum Beispiel ist ein autoregressives (8220AR (1) 8221) Modell erster Ordnung für Y ein einfaches Regressionsmodell, bei dem die unabhängige Variable nur Y um eine Periode (LAG (Y, 1) in Statgraphics oder YLAG1 in RegressIt hinterlässt). Wenn einige der Prädiktoren die Fehler der Fehler sind, ist es ein ARIMA-Modell, es ist kein lineares Regressionsmodell, denn es gibt keine Möglichkeit, 828last period8217s error8221 als unabhängige Variable anzugeben: Die Fehler müssen auf einer Periodenperiode berechnet werden Wenn das Modell an die Daten angepasst ist. Aus technischer Sicht ist das Problem bei der Verwendung von verzögerten Fehlern als Prädiktoren, dass die Vorhersagen des Modells8217 nicht lineare Funktionen der Koeffizienten sind. Obwohl sie lineare Funktionen der vergangenen Daten sind. So müssen Koeffizienten in ARIMA-Modellen, die verzögerte Fehler enthalten, durch nichtlineare Optimierungsmethoden (8220hill-climbing8221) geschätzt werden, anstatt nur ein Gleichungssystem zu lösen. Das Akronym ARIMA steht für Auto-Regressive Integrated Moving Average. Die Verzögerungen der stationärisierten Serien in der Prognosegleichung werden als quartalspezifische Begriffe bezeichnet, die Verzögerungen der Prognosefehler werden als quadratische Begrenzungsterme bezeichnet, und eine Zeitreihe, die differenziert werden muss, um stationär zu sein, wird als eine quotintegrierte Quotversion einer stationären Serie bezeichnet. Random-Walk - und Random-Trend-Modelle, autoregressive Modelle und exponentielle Glättungsmodelle sind alle Sonderfälle von ARIMA-Modellen. Ein Nicht-Seasonal-ARIMA-Modell wird als ein Quoten-Modell von quaremA (p, d, q) klassifiziert, wobei p die Anzahl der autoregressiven Terme ist, d die Anzahl der für die Stationarität benötigten Nichtseasondifferenzen und q die Anzahl der verzögerten Prognosefehler in Die Vorhersagegleichung. Die Prognosegleichung wird wie folgt aufgebaut. Zuerst bezeichne y die d-te Differenz von Y. Das bedeutet: Beachten Sie, dass die zweite Differenz von Y (der Fall d2) nicht der Unterschied von 2 Perioden ist. Vielmehr ist es der erste Unterschied zwischen dem ersten Unterschied. Welches das diskrete Analog einer zweiten Ableitung ist, d. h. die lokale Beschleunigung der Reihe und nicht deren lokaler Trend. In Bezug auf y. Die allgemeine Prognosegleichung lautet: Hier werden die gleitenden Durchschnittsparameter (9528217s) so definiert, dass ihre Zeichen in der Gleichung nach der von Box und Jenkins eingeführten Konventionen negativ sind. Einige Autoren und Software (einschließlich der R-Programmiersprache) definieren sie so, dass sie stattdessen Pluszeichen haben. Wenn tatsächliche Zahlen in die Gleichung gesteckt sind, gibt es keine Mehrdeutigkeit, aber it8217s wichtig zu wissen, welche Konvention Ihre Software verwendet, wenn Sie die Ausgabe lesen. Oft werden die Parameter dort mit AR (1), AR (2), 8230 und MA (1), MA (2), 8230 usw. bezeichnet. Um das entsprechende ARIMA-Modell für Y zu identifizieren, beginnen Sie mit der Bestimmung der Reihenfolge der Differenzierung (D) die Serie zu stationieren und die Brutto-Merkmale der Saisonalität zu entfernen, vielleicht in Verbindung mit einer abweichungsstabilisierenden Transformation wie Protokollierung oder Entleerung. Wenn Sie an dieser Stelle anhalten und vorhersagen, dass die differenzierte Serie konstant ist, haben Sie nur einen zufälligen Spaziergang oder ein zufälliges Trendmodell ausgestattet. Allerdings können die stationärisierten Serien immer noch autokorrelierte Fehler aufweisen, was darauf hindeutet, dass in der Prognosegleichung auch eine Anzahl von AR-Terme (p 8805 1) und einigen einigen MA-Terme (q 8805 1) benötigt werden. Der Prozess der Bestimmung der Werte von p, d und q, die am besten für eine gegebene Zeitreihe sind, wird in späteren Abschnitten der Noten (deren Links oben auf dieser Seite), aber eine Vorschau auf einige der Typen diskutiert werden Von nicht-seasonalen ARIMA-Modellen, die häufig angetroffen werden, ist unten angegeben. ARIMA (1,0,0) Autoregressives Modell erster Ordnung: Wenn die Serie stationär und autokorreliert ist, kann man sie vielleicht als Vielfaches ihres eigenen vorherigen Wertes und einer Konstante voraussagen. Die prognostizierte Gleichung in diesem Fall ist 8230which ist Y regressed auf sich selbst verzögerte um einen Zeitraum. Dies ist ein 8220ARIMA (1,0,0) constant8221 Modell. Wenn der Mittelwert von Y Null ist, dann wäre der konstante Term nicht enthalten. Wenn der Steigungskoeffizient 981 & sub1; positiv und kleiner als 1 in der Grße ist (er muß kleiner als 1 in der Grße sein, wenn Y stationär ist), beschreibt das Modell das Mittelwiederkehrungsverhalten, bei dem der nächste Periode8217s-Wert 981 mal als vorher vorausgesagt werden sollte Weit weg von dem Mittelwert als dieser Zeitraum8217s Wert. Wenn 981 & sub1; negativ ist, prognostiziert es ein Mittelrückkehrverhalten mit einem Wechsel von Zeichen, d. h. es sagt auch, daß Y unterhalb der mittleren nächsten Periode liegt, wenn es über dem Mittelwert dieser Periode liegt. In einem autoregressiven Modell zweiter Ordnung (ARIMA (2,0,0)) wäre auch ein Y-t-2-Term auf der rechten Seite und so weiter. Abhängig von den Zeichen und Größen der Koeffizienten könnte ein ARIMA (2,0,0) Modell ein System beschreiben, dessen mittlere Reversion in einer sinusförmig oszillierenden Weise stattfindet, wie die Bewegung einer Masse auf einer Feder, die zufälligen Schocks ausgesetzt ist . ARIMA (0,1,0) zufälliger Spaziergang: Wenn die Serie Y nicht stationär ist, ist das einfachste Modell für sie ein zufälliges Spaziergangmodell, das als Begrenzungsfall eines AR (1) - Modells betrachtet werden kann, in dem das autoregressive Koeffizient ist gleich 1, dh eine Serie mit unendlich langsamer mittlerer Reversion. Die Vorhersagegleichung für dieses Modell kann wie folgt geschrieben werden: wobei der konstante Term die mittlere Periodenänderung (dh die Langzeitdrift) in Y ist. Dieses Modell könnte als ein Nicht-Intercept-Regressionsmodell eingebaut werden, in dem die Die erste Differenz von Y ist die abhängige Variable. Da es (nur) eine nicht-seasonale Differenz und einen konstanten Term enthält, wird es als ein quotARIMA (0,1,0) Modell mit constant. quot eingestuft. Das random-walk-without - drift-Modell wäre ein ARIMA (0,1, 0) Modell ohne Konstante ARIMA (1,1,0) differenzierte Autoregressive Modell erster Ordnung: Wenn die Fehler eines zufälligen Walk-Modells autokorreliert werden, kann das Problem eventuell durch Hinzufügen einer Verzögerung der abhängigen Variablen zu der Vorhersagegleichung behoben werden - - ie Durch den Rücktritt der ersten Differenz von Y auf sich selbst um eine Periode verzögert. Dies würde die folgende Vorhersagegleichung ergeben: die umgewandelt werden kann Dies ist ein autoregressives Modell erster Ordnung mit einer Reihenfolge von Nicht-Seasonal-Differenzen und einem konstanten Term - d. h. Ein ARIMA (1,1,0) Modell. ARIMA (0,1,1) ohne konstante, einfache exponentielle Glättung: Eine weitere Strategie zur Korrektur autokorrelierter Fehler in einem zufälligen Walk-Modell wird durch das einfache exponentielle Glättungsmodell vorgeschlagen. Erinnern Sie sich, dass für einige nichtstationäre Zeitreihen (z. B. diejenigen, die geräuschvolle Schwankungen um ein langsam variierendes Mittel aufweisen), das zufällige Wandermodell nicht so gut wie ein gleitender Durchschnitt von vergangenen Werten ausführt. Mit anderen Worten, anstatt die jüngste Beobachtung als die Prognose der nächsten Beobachtung zu nehmen, ist es besser, einen Durchschnitt der letzten Beobachtungen zu verwenden, um das Rauschen herauszufiltern und das lokale Mittel genauer zu schätzen. Das einfache exponentielle Glättungsmodell verwendet einen exponentiell gewichteten gleitenden Durchschnitt von vergangenen Werten, um diesen Effekt zu erzielen. Die Vorhersagegleichung für das einfache exponentielle Glättungsmodell kann in einer Anzahl von mathematisch äquivalenten Formen geschrieben werden. Eine davon ist die so genannte 8220error Korrektur8221 Form, in der die vorherige Prognose in Richtung des Fehlers eingestellt wird, die es gemacht hat: Weil e t-1 Y t-1 - 374 t-1 per Definition, kann dies wie folgt umgeschrieben werden : Das ist eine ARIMA (0,1,1) - ohne Konstante Prognose Gleichung mit 952 1 1 - 945. Dies bedeutet, dass Sie eine einfache exponentielle Glättung passen können, indem Sie es als ARIMA (0,1,1) Modell ohne Konstant und der geschätzte MA (1) - Koeffizient entspricht 1-minus-alpha in der SES-Formel. Erinnern daran, dass im SES-Modell das Durchschnittsalter der Daten in den 1-Perioden-Prognosen 1 945 beträgt. Dies bedeutet, dass sie dazu neigen, hinter Trends oder Wendepunkten um etwa 1 945 Perioden zurückzukehren. Daraus folgt, dass das Durchschnittsalter der Daten in den 1-Periodenprognosen eines ARIMA (0,1,1) - without-constant-Modells 1 (1 - 952 1) beträgt. So, zum Beispiel, wenn 952 1 0.8, ist das Durchschnittsalter 5. Wenn 952 1 sich nähert, wird das ARIMA (0,1,1) - without-konstantes Modell zu einem sehr langfristigen gleitenden Durchschnitt und als 952 1 Nähert sich 0 wird es zu einem zufälligen Walk-ohne-Drift-Modell. Was ist der beste Weg, um Autokorrelation zu korrigieren: Hinzufügen von AR-Terme oder Hinzufügen von MA-Terme In den vorangegangenen zwei Modellen, die oben diskutiert wurden, wurde das Problem der autokorrelierten Fehler in einem zufälligen Walk-Modell auf zwei verschiedene Arten festgelegt: durch Hinzufügen eines verzögerten Wertes der differenzierten Serie Zur Gleichung oder Hinzufügen eines verzögerten Wertes des Prognosefehlers. Welcher Ansatz ist am besten Eine Faustregel für diese Situation, die später noch ausführlicher erörtert wird, ist, dass eine positive Autokorrelation in der Regel am besten durch Hinzufügen eines AR-Termes zum Modell behandelt wird und eine negative Autokorrelation wird meist am besten durch Hinzufügen eines MA Begriff. In geschäftlichen und ökonomischen Zeitreihen entsteht oftmals eine negative Autokorrelation als Artefakt der Differenzierung. (Im Allgemeinen verringert die Differenzierung die positive Autokorrelation und kann sogar einen Wechsel von positiver zu negativer Autokorrelation verursachen.) So wird das ARIMA (0,1,1) - Modell, in dem die Differenzierung von einem MA-Term begleitet wird, häufiger als ein ARIMA (1,1,0) Modell. ARIMA (0,1,1) mit konstanter, einfacher, exponentieller Glättung mit Wachstum: Durch die Implementierung des SES-Modells als ARIMA-Modell erhalten Sie gewisse Flexibilität. Zunächst darf der geschätzte MA (1) - Koeffizient negativ sein. Dies entspricht einem Glättungsfaktor größer als 1 in einem SES-Modell, was in der Regel nicht durch das SES-Modell-Anpassungsverfahren erlaubt ist. Zweitens haben Sie die Möglichkeit, einen konstanten Begriff im ARIMA-Modell einzubeziehen, wenn Sie es wünschen, um einen durchschnittlichen Trend ungleich Null abzuschätzen. Das ARIMA (0,1,1) - Modell mit Konstante hat die Vorhersagegleichung: Die Prognosen von einem Periodenvorhersage aus diesem Modell sind qualitativ ähnlich denen des SES-Modells, mit der Ausnahme, dass die Trajektorie der Langzeitprognosen typischerweise ein Schräge Linie (deren Steigung gleich mu ist) anstatt einer horizontalen Linie. ARIMA (0,2,1) oder (0,2,2) ohne konstante lineare exponentielle Glättung: Lineare exponentielle Glättungsmodelle sind ARIMA-Modelle, die zwei Nichtseason-Differenzen in Verbindung mit MA-Terme verwenden. Der zweite Unterschied einer Reihe Y ist nicht einfach der Unterschied zwischen Y und selbst, der um zwei Perioden verzögert ist, sondern vielmehr der erste Unterschied der ersten Differenz - i. e. Die Änderung der Änderung von Y in der Periode t. Somit ist die zweite Differenz von Y in der Periode t gleich (Y t - Y t - 1) - (Y t - 1 - Y t - 2) Y t - 2Y t - 1 Y t - 2. Eine zweite Differenz einer diskreten Funktion ist analog zu einer zweiten Ableitung einer stetigen Funktion: sie misst die quotaccelerationquot oder quotcurvaturequot in der Funktion zu einem gegebenen Zeitpunkt. Das ARIMA (0,2,2) - Modell ohne Konstante prognostiziert, dass die zweite Differenz der Serie gleich einer linearen Funktion der letzten beiden Prognosefehler ist: die umgeordnet werden kann: wobei 952 1 und 952 2 die MA (1) und MA (2) Koeffizienten Dies ist ein allgemeines lineares exponentielles Glättungsmodell. Im Wesentlichen das gleiche wie Holt8217s Modell, und Brown8217s Modell ist ein Sonderfall. Es verwendet exponentiell gewichtete Bewegungsdurchschnitte, um sowohl eine lokale Ebene als auch einen lokalen Trend in der Serie abzuschätzen. Die langfristigen Prognosen von diesem Modell konvergieren zu einer geraden Linie, deren Hang hängt von der durchschnittlichen Tendenz, die gegen Ende der Serie beobachtet wird. ARIMA (1,1,2) ohne konstante gedämpfte Trend-lineare exponentielle Glättung. Dieses Modell wird in den beiliegenden Folien auf ARIMA-Modellen dargestellt. Es extrapoliert den lokalen Trend am Ende der Serie, aber erhebt es bei längeren Prognosehorizonten, um eine Note des Konservatismus einzuführen, eine Praxis, die empirische Unterstützung hat. Sehen Sie den Artikel auf quotWhy der Damped Trend Workquot von Gardner und McKenzie und die quotGolden Rulequot Artikel von Armstrong et al. für Details. Es ist grundsätzlich ratsam, an Modellen zu bleiben, bei denen mindestens eines von p und q nicht größer als 1 ist, dh nicht versuchen, ein Modell wie ARIMA (2,1,2) zu passen, da dies wahrscheinlich zu Überfüllung führen wird Und quotcommon-factorquot-Themen, die ausführlicher in den Anmerkungen zur mathematischen Struktur von ARIMA-Modellen diskutiert werden. Spreadsheet-Implementierung: ARIMA-Modelle wie die oben beschriebenen sind einfach in einer Kalkulationstabelle zu implementieren. Die Vorhersagegleichung ist einfach eine lineare Gleichung, die sich auf vergangene Werte der ursprünglichen Zeitreihen und vergangene Werte der Fehler bezieht. So können Sie eine ARIMA-Prognosekalkulationstabelle einrichten, indem Sie die Daten in Spalte A, die Prognoseformel in Spalte B und die Fehler (Daten minus Prognosen) in Spalte C speichern. Die Prognoseformel in einer typischen Zelle in Spalte B wäre einfach Ein linearer Ausdruck, der sich auf Werte in vorhergehenden Zeilen der Spalten A und C bezieht, multipliziert mit den entsprechenden AR - oder MA-Koeffizienten, die in Zellen anderswo auf der Kalkulationstabelle gespeichert sind. Autoregressive Moving Average ARMA (p, q) Modelle für die Zeitreihenanalyse - Teil 3 Dies ist Die dritte und letzte Post in der Mini-Serie auf Autoregressive Moving Average (ARMA) Modelle für die Zeitreihenanalyse. Weve eingeführt Autoregressive Modelle und Moving Average Modelle in den beiden vorherigen Artikeln. Jetzt ist es Zeit, sie zu kombinieren, um ein anspruchsvolleres Modell zu produzieren. Letztlich wird uns dies zu den ARIMA - und GARCH-Modellen führen, die es uns ermöglichen, die Vermögensrenditen vorherzusagen und die Volatilität zu prognostizieren. Diese Modelle bilden die Grundlage für den Handel von Signalen und Risikomanagementtechniken. Wenn Sie Teil 1 und Teil 2 lesen, werden Sie gesehen haben, dass wir ein Muster für unsere Analyse eines Zeitreihenmodells folgen. Ill wiederholen Sie es kurz hier: Begründung - Warum interessieren wir uns für dieses spezielle Modell Definition - Eine mathematische Definition, um Mehrdeutigkeit zu reduzieren. Correlogram - Plotten eines Beispiel-Korrelogramms, um ein Modellverhalten zu visualisieren. Simulation und Montage - Anpassung des Modells an Simulationen, um sicherzustellen, dass wir das Modell richtig verstanden haben. Echte Finanzdaten - Bewerben Sie das Modell auf echte historische Vermögenspreise. Vorhersage - Prognose nachfolgende Werte zum Erstellen von Handelssignalen oder Filtern. Um diesem Artikel zu folgen, empfiehlt es sich, die vorherigen Artikel zur Zeitreihenanalyse zu betrachten. Sie können alle hier gefunden werden. Bayesian Information Criterion In Teil 1 dieser Artikelserie sahen wir das Akaike Information Criterion (AIC) als Mittel an, uns dabei zu helfen, zwischen separaten besten Zeitreihenmodellen zu wählen. Ein eng verwandtes Werkzeug ist das Bayesian Information Criterion (BIC). Im Wesentlichen hat es ein ähnliches Verhalten gegenüber der AIC, dass es Modelle für mit zu vielen Parametern bestraft. Dies kann zu Überfüllung führen. Der Unterschied zwischen dem BIC und dem AIC ist, dass der BIC mit seiner Bestrafung zusätzlicher Parameter strenger ist. Bayesian Information Criterion Wenn wir die Wahrscheinlichkeitsfunktion für ein statistisches Modell, das k Parameter hat, und L maximiert die Wahrscheinlichkeit zu nehmen. Dann ist das Bayesian Information Criterion gegeben durch: Wo n ist die Anzahl der Datenpunkte in der Zeitreihe. Wir werden bei der Auswahl geeigneter ARMA (p, q) Modelle die AIC und BIC verwenden. Ljung-Box Test In Teil 1 dieser Artikel-Serie Rajan erwähnt in der Disqus Bemerkungen, dass die Ljung-Box-Test war besser geeignet als mit dem Akaike Information Criterion der Bayesian Information Criterion bei der Entscheidung, ob ein ARMA-Modell war eine gute Passform zu einer Zeit Serie. Der Ljung-Box-Test ist ein klassischer Hypothesentest, der entworfen ist, um zu testen, ob ein Satz von Autokorrelationen eines angepassten Zeitreihenmodells sich deutlich von Null unterscheidet. Der Test testet nicht jede einzelne Verzögerung für Zufälligkeit, sondern prüft die Zufälligkeit über eine Gruppe von Verzögerungen. Ljung-Box-Test Wir definieren die Nullhypothese als: Die Zeitreihendaten bei jeder Verzögerung sind i. i.d .. das heißt, die Korrelationen zwischen den Populationsreihenwerten sind Null. Wir definieren die alternative Hypothese als: Die Zeitreihendaten sind nicht i. i.d. Und besitzen eine serielle Korrelation. Wir berechnen die folgende Teststatistik. Q: Wenn n die Länge der Zeitreihenprobe ist, ist H die Probe Autokorrelation bei Verzögerung k und h ist die Anzahl der Verzögerungen unter dem Test. Die Entscheidungsregel, ob die Nullhypothese zurückgewiesen werden soll, besteht darin, zu prüfen, ob Q gt chi2, für eine chi-quadratische Verteilung mit h Freiheitsgraden bei dem 100 (1-alpha) - ten Perzentil. Während die Details des Tests etwas kompliziert erscheinen können, können wir in der Tat R verwenden, um den Test für uns zu berechnen, was die Prozedur etwas vereinfacht. Autogressive Moving Average (ARMA) Modelle der Ordnung p, q Nun, da wir den BIC und den Ljung-Box-Test besprochen haben, waren wir bereit, unser erstes gemischtes Modell zu besprechen, nämlich den Autoregressiven Moving Average der Ordnung p, q oder ARMA (p, Q). Bisher haben wir autoregressive Prozesse und gleitende Mittelprozesse betrachtet. Das ehemalige Modell betrachtet sein eigenes vergangenes Verhalten als Inputs für das Modell und als solche Versuche, Marktteilnehmereffekte wie Impuls und Mittelwertreduktion im Aktienhandel zu erfassen. Das letztere Modell wird verwendet, um Schock-Informationen zu einer Serie zu charakterisieren, wie etwa eine Überraschungs-Gewinn-Ankündigung oder ein unerwartetes Ereignis (wie die BP Deepwater Horizon Ölpest). Daher versucht ein ARMA-Modell, diese beiden Aspekte bei der Modellierung von finanziellen Zeitreihen zu erfassen. Beachten Sie, dass ein ARMA-Modell nicht berücksichtigt Volatilität Clustering, eine wichtige empirische Phänomene von vielen finanziellen Zeitreihen. Es ist kein bedingungslos heteroscedastisches Modell. Dafür müssen wir auf die ARCH - und GARCH-Modelle warten. Definition Das ARMA (p, q) Modell ist eine lineare Kombination von zwei linearen Modellen und ist damit selbst noch linear: Autoregressives Moving Average Modell der Ordnung p, q Ein Zeitreihenmodell, ist ein autoregressives gleitendes durchschnittliches Modell der Ordnung p, q . ARMA (p, q), wenn: xt alpha1 x alpha2 x ldots wt beta1 w beta2 w ldots betaq w Ende Wo ist weißes Rauschen mit E (wt) 0 und Varianz sigma2. Wenn wir den Backward Shift Operator betrachten. (Siehe einen vorherigen Artikel), dann können wir das obige als Funktion theta und phi umschreiben: Wir können einfach sehen, dass durch die Einstellung von p neq 0 und q0 wir das AR (p) Modell wiederherstellen. Ähnlich, wenn wir p 0 und q neq 0 setzen, gewinnen wir das MA (q) Modell zurück. Eines der Hauptmerkmale des ARMA-Modells ist, dass es in seinen Parametern sparsam und redundant ist. Das heißt, ein ARMA-Modell benötigt oft weniger Parameter als ein AR (p) oder MA (q) - Modell allein. Darüber hinaus, wenn wir die Gleichung in Bezug auf die BSO umschreiben, dann können die theta und phi Polynome manchmal einen gemeinsamen Faktor teilen, was zu einem einfacheren Modell führt. Simulationen und Correlograms Wie bei den autoregressiven und gleitenden Durchschnittsmodellen werden wir nun verschiedene ARMA-Serien simulieren und dann versuchen, ARMA-Modelle an diese Realisierungen anzupassen. Wir führen dies aus, weil wir sicherstellen wollen, dass wir das Anpassungsverfahren verstehen, einschließlich der Berechnung von Konfidenzintervallen für die Modelle, sowie sicherstellen, dass das Verfahren tatsächlich angemessene Schätzungen für die ursprünglichen ARMA-Parameter wiederherstellt. In Teil 1 und Teil 2 haben wir die AR - und MA-Serie manuell konstruiert, indem wir N Abtastwerte aus einer Normalverteilung ziehen und dann das spezifische Zeitreihenmodell unter Verwendung von Verzögerungen dieser Proben erstellen. Allerdings gibt es einen einfacheren Weg, um AR-, MA-, ARMA - und sogar ARIMA-Daten zu simulieren, indem einfach die arima. sim-Methode in R verwendet wird. Beginnen wir mit dem einfachsten nicht-trivialen ARMA-Modell, nämlich dem ARMA (1,1 ) Modell. Das heißt, ein autoregressives Modell der Ordnung, kombiniert mit einem gleitenden Durchschnittsmodell der Ordnung eins. Ein solches Modell hat nur zwei Koeffizienten, Alpha und Beta, die die ersten Verzögerungen der Zeitreihe selbst und die schockweißen Rauschbegriffe darstellen. Ein solches Modell ist gegeben durch: Wir müssen die Koeffizienten vor der Simulation angeben. Nehmen wir alpha 0,5 und beta -0,5: Die Ausgabe ist wie folgt: Lets auch das Korrelogramm: Wir können sehen, dass es keine signifikante Autokorrelation gibt, die von einem ARMA (1,1) - Modell zu erwarten ist. Schließlich können wir die Koeffizienten und ihre Standardfehler mit der arima-Funktion ausführen: Wir können die Konfidenzintervalle für jeden Parameter mit den Standardfehlern berechnen: Die Konfidenzintervalle enthalten die wahren Parameterwerte für beide Fälle, aber wir sollten beachten, dass die 95 Konfidenzintervalle sind sehr breit (eine Folge der vernünftig großen Standardfehler). Lass jetzt ein ARMA (2,2) Modell versuchen. Das heißt, ein AR (2) Modell kombiniert mit einem MA (2) Modell. Wir müssen vier Parameter für dieses Modell angeben: alpha1, alpha2, beta1 und beta2. Nehmen wir alpha1 0,5, alpha2-0.25 beta10.5 und beta2-0.3: Die Ausgabe unseres ARMA (2,2) Modells ist wie folgt: Und die entsprechende Autocorelation: Wir können nun versuchen, ein ARMA (2,2) Modell anzupassen Die Daten: Wir können auch die Konfidenzintervalle für jeden Parameter berechnen: Beachten Sie, dass die Konfidenzintervalle für die Koeffizienten für die gleitende Durchschnittskomponente (beta1 und beta2) tatsächlich nicht den ursprünglichen Parameterwert enthalten. Dies stellt die Gefahr dar, dass man versucht, Modelle an Daten anzupassen, auch wenn wir die wahren Parameterwerte kennen. Aber für Handelszwecke müssen wir nur eine prädiktive Kraft haben, die den Zufall übersteigt und genügend Gewinn über den Transaktionskosten produziert, um rentabel zu sein auf lange Sicht. Nun, da wir einige Beispiele für simulierte ARMA-Modelle gesehen haben, brauchen wir einen Mechanismus zur Auswahl der Werte von p und q bei der Anpassung an die Modelle an reale Finanzdaten. Auswählen des besten ARMA (p, q) Modells Um zu bestimmen, welche Reihenfolge p, q des ARMA-Modells für eine Serie geeignet ist, müssen wir die AIC (oder BIC) über eine Teilmenge von Werten für p, q und Dann den Ljung-Box-Test anwenden, um festzustellen, ob eine gute Passung erreicht ist, für bestimmte Werte von p, q. Um diese Methode zu zeigen, werden wir zunächst einen bestimmten ARMA (p, q) Prozess simulieren. Wir werden dann alle paarweise Werte von p in und q in und über die AIC berechnen. Wir wählen das Modell mit dem niedrigsten AIC und führen dann einen Ljung-Box-Test auf die Residuen, um festzustellen, ob wir eine gute Passform erreicht haben. Lasst uns anfangen, eine ARMA (3,2) - Serie zu simulieren: Wir erstellen nun ein Objekt endgültig, um die beste Modellanpassung und den niedrigsten AIC-Wert zu speichern. Wir schleifen über die verschiedenen p, q Kombinationen und verwenden das aktuelle Objekt, um die Anpassung eines ARMA (i, j) Modells für die Looping Variablen i und j zu speichern. Wenn die aktuelle AIC kleiner als jede zuvor berechnete AIC ist, setzen wir die endgültige AIC auf diesen aktuellen Wert und wählen diese Reihenfolge aus. Nach Beendigung der Schleife haben wir die Reihenfolge des ARMA-Modells in final. order gespeichert und die ARIMA (p, d, q) passen sich an (mit der integrierten d-Komponente auf 0) als final. arma gespeichert: Letzt die Ausgabe der AIC , Ordnung und ARIMA Koeffizienten: Wir können sehen, dass die ursprüngliche Reihenfolge des simulierten ARMA-Modells wiederhergestellt wurde, nämlich mit p3 und q2. Wir können das Corelogramm der Residuen des Modells abbilden, um zu sehen, ob sie wie eine Realisierung von diskreten weißen Geräuschen (DWN) aussehen: Das Corelogramm sieht in der Tat wie eine Realisierung von DWN aus. Schließlich führen wir den Ljung-Box-Test für 20 Verzögerungen durch, um dies zu bestätigen: Beachten Sie, dass der p-Wert größer als 0,05 ist, was besagt, dass die Residuen auf der 95-Ebene unabhängig sind und somit ein ARMA (3,2) - Modell eine Gutes modell passend Eindeutig sollte dies der Fall sein, da wir die Daten selbst simuliert haben. Dies ist jedoch genau das Verfahren, das wir verwenden werden, wenn wir ARMA (p, q) Modelle auf den SampP500 Index im folgenden Abschnitt passen. Finanzdaten Nun, da wir das Verfahren zur Auswahl des optimalen Zeitreihenmodells für eine simulierte Serie skizziert haben, ist es ziemlich einfach, es auf Finanzdaten anzuwenden. Für dieses Beispiel werden wir noch einmal den SampP500 US Equity Index wählen. Lässt die täglichen Schlusskurse mit quantmod herunterladen und dann den Log-Return-Stream erstellen: Lass die gleiche Anpassungsprozedur wie für die simulierte ARMA (3,2) - Serie oben auf der Log-Returns-Serie des SampP500 mit dem AIC: Das beste passende Modell Hat bestellen ARMA (3,3): Lets Plot die Residuen des angepassten Modells auf die SampP500 log täglichen Renditen Stream: Beachten Sie, dass es einige signifikante Spitzen, vor allem bei höheren Lags. Dies ist ein Hinweis auf eine schlechte Passform. Lasst uns einen Ljung-Box-Test durchführen, um zu sehen, ob wir statistische Beweise dafür haben: Wie wir vermutet haben, ist der p-Wert weniger als 0,05 und als solche können wir nicht sagen, dass die Residuen eine Realisierung von diskreten weißen Rauschen sind. Daher gibt es eine zusätzliche Autokorrelation in den Resten, die nicht durch das eingebaute ARMA (3,3) Modell erklärt wird. Nächste Schritte Wie wir in dieser Artikelserie ausführlich diskutiert haben, haben wir in der SampP500-Serie vor allem in den Perioden um 2007-2008 einen Hinweis auf eine bedingte Heterosedastizität (Volatilitätsclustering) gesehen. Wenn wir ein GARCH-Modell später in der Artikelserie verwenden, werden wir sehen, wie man diese Autokorrelationen beseitigt. In der Praxis sind ARMA-Modelle niemals im Allgemeinen gut passt für Log-Aktien-Renditen. Wir müssen die bedingte Heterosedastizität berücksichtigen und eine Kombination aus ARIMA und GARCH verwenden. Der nächste Artikel wird ARIMA betrachten und zeigen, wie sich die integrierte Komponente von dem ARMA-Modell unterscheidet, das wir in diesem Artikel berücksichtigt haben. Nur mit dem quantitativen Handel begonnen
ULTIMATE Questrade Review 2017 Questrade hat sich als Online-Brokerage-Führer in Kanada durch Catering hervorragend für alle Mainstream-Investoren entpuppt. Sie haben die niedrigsten Provisionen in Kanada durch eine demokratische Preisstruktur, neben hervorragenden Forschungsinstrumenten und soliden Handelsplattformen. Questrade gilt auch als der am schnellsten wachsende Finanzdienstleister zum Teil aufgrund des hervorragenden Kundenservice. 9660 Scroll Down für die In-Depth Review WrittenUpdated von Emma Li am Samstag, 25. Februar 2017 Editor Bewertung: (90) User-Rating: (95) Wäre es kommt zu investieren in 2017 die Trading-Landschaft ist gebadet und platzen an den Nähten mit Unzählige Finanzmaklerhäuser. Große Namen wie BMO InvestorLine, RBC Direct Investing, TD Direct Investing, Interactive Brokers, Scotia iTrade und mindestens ein Dutzend mehr stehen zur Auswahl. Traurig, durch tiefergehende Analyse kann man leicht unterscheidende Unterschiede zwischen ihnen, vor allem im Kreis der...
Comments
Post a Comment