ARIMA Vorhersage mit Excel und R Hallo Heute gehe ich Sie durch eine Einführung in das ARIMA-Modell und seine Komponenten sowie eine kurze Erläuterung der Box-Jenkins-Methode, wie ARIMA-Modelle angegeben sind. Schließlich habe ich eine Excel-Implementierung mit R, die I8217ll zeigen Ihnen, wie Sie einrichten und verwenden. Autoregressive Moving Average (ARMA) Modelle Das Autoregressive Moving Average Modell dient zur Modellierung und Prognose stationärer, stochastischer Zeitreihenprozesse. Es ist die Kombination von zwei zuvor entwickelten statistischen Techniken, den Autoregressiven (AR) und Moving Average (MA) Modellen und wurde ursprünglich von Peter Whittle im Jahre 1951 beschrieben. George E. P. Box und Gwilym Jenkins popularisierten das Modell im Jahr 1971 durch die Festlegung diskreter Schritte zur Modellierung, Schätzung und Überprüfung. Dieser Vorgang wird später als Referenz beschrieben. Wir werden mit der Einführung des ARMA-Modells durch die verschiedenen Komponenten, die AR - und MA-Modelle beginnen und dann eine populäre Verallgemeinerung des ARMA-Modells ARIMA (Autoregressive Integrated Moving Average) und Prognose - und Modellspezifikationsschritte vorstellen. Schließlich werde ich erklären, eine Excel-Implementierung, die ich erstellt und wie man es verwendet, um Ihre Zeitreihe Prognosen zu machen. Autoregressive Modelle Das Autoregressive Modell dient zur Beschreibung von zufälligen Prozessen und zeitveränderlichen Prozessen und gibt an, dass die Ausgangsvariable linear von den bisherigen Werten abhängt. Das Modell wird beschrieben als: Xt c sum varphii, Xt-i varepsilont Wo varphi1, ldots, varphivarphi sind die Parameter des Modells, C ist konstant, und varepsilont ist ein weißer Rauschen Begriff. Im Wesentlichen, was das Modell beschreibt, ist für jeden gegebenen Wert X (t). Es kann durch Funktionen seines vorherigen Wertes erklärt werden. Für ein Modell mit einem Parameter wird varphi 1. X (t) durch seinen vergangenen Wert X (t-1) und den zufälligen Fehler varepsilont erklärt. Für ein Modell mit mehr als einem Parameter, zB varphi 2. X (t) ist gegeben durch X (t-1). X (t-2) und zufälliger Fehler varepsilont. Moving Average Model Das Moving Average (MA) Modell wird oft für die Modellierung von univariaten Zeitreihen verwendet und ist definiert als: Xt mu varepsilont theta1, varepsilon ldots thetaq, varepsilon mu ist der Mittelwert der Zeitreihe. Theta1, ldots, thetaq sind die Parameter des Modells. Varepsilont, varepsilon, ldots sind die weißen Rauschfehler Begriffe. Q ist die Reihenfolge des Moving Average-Modells. Das Moving Average-Modell ist eine lineare Regression des aktuellen Wertes der Serie im Vergleich zu Varepsilont-Terme in der vorherigen Periode, t. Varepsilon Zum Beispiel wird ein MA-Modell von q 1. X (t) durch den aktuellen Fehler varepsilont in der gleichen Periode und den vergangenen Fehlerwert, varepsilon erklärt. Für ein Modell der Ordnung 2 (q 2) wird X (t) durch die beiden letzten Fehlerwerte Varepsilon und Varepsilon erklärt. Die AR (p) und MA (q) Begriffe werden im ARMA-Modell verwendet, das nun eingeführt wird. Autoregressive Moving Average Model Autoregressive Moving Durchschnittliche Modelle verwenden zwei Polynome, AR (p) und MA (q) und beschreiben einen stationären stochastischen Prozess. Ein stationärer Prozeß ändert sich nicht, wenn er in Zeit oder Raum verschoben wird, daher hat ein stationärer Prozeß konstantes Mittel und Varianz. Das ARMA-Modell wird oft in Bezug auf seine Polynome, ARMA (p, q) bezeichnet. Die Notation des Modells ist geschrieben: Xt c varepsilont sum varphi1 X sum thetai varepsilon Das Auswählen, Schätzen und Verifizieren des Modells wird durch den Box-Jenkins-Prozess beschrieben. Box-Jenkins-Methode für die Modellidentifikation Im Folgenden finden Sie einen Überblick über die Box-Jenkins-Methode, da der eigentliche Prozess der Suche nach diesen Werten ohne ein statistisches Paket sehr überwältigend sein kann. Das auf dieser Seite enthaltene Excel-Blatt bestimmt automatisch das passendste Modell. Der erste Schritt der Box-Jenkins-Methode ist die Modellidentifikation. Der Schritt umfasst die Identifizierung der Saisonalität, die Differenzierung bei Bedarf und die Bestimmung der Reihenfolge von p und q durch Auftragen der Autokorrelations - und Teilautokorrelationsfunktionen. Nachdem das Modell identifiziert wurde, schätzt der nächste Schritt die Parameter. Die Parameterschätzung verwendet statistische Pakete und Berechnungsalgorithmen, um die passenden Parameter zu finden. Sobald die Parameter gewählt sind, prüft der letzte Schritt das Modell. Die Modellprüfung erfolgt durch Testen, um zu sehen, ob das Modell einer stationären, univariaten Zeitreihe entspricht. Man sollte auch bestätigen, dass die Residuen unabhängig voneinander sind und ein konstantes Mittel und eine Abweichung über die Zeit aufweisen, was durch die Durchführung eines Ljung-Box-Tests oder nochmals die Autokorrelation und die partielle Autokorrelation der Residuen erfolgen kann. Beachten Sie den ersten Schritt beinhaltet die Überprüfung auf Saisonalität. Wenn die Daten, mit denen Sie arbeiten, saisonale Trends enthält, sind Sie 8220difference8221, um die Daten stationär zu machen. Dieser differenzierende Schritt verallgemeinert das ARMA-Modell in ein ARIMA-Modell oder Autoregressive Integrated Moving Average, wobei 8216Integrated8217 dem differenzierenden Schritt entspricht. Autoregressive integrierte Moving Average Modelle Das ARIMA Modell hat drei Parameter, p, d, q. Um das ARMA-Modell so zu definieren, dass es den differenzierenden Term beinhaltet, beginnen wir mit der Umstellung des Standard-ARMA-Modells, um X (t) Latex und Latex Varepsilont aus der Summation zu trennen. (1 - Summe Alphai Li) Xt (1 Summe thetai Li) varepsilont Wo L der Lagoperator und Alphai ist. Thetai Varepsilont sind autoregressive und gleitende Durchschnittsparameter und die Fehlerbegriffe. Wir nehmen nun die Annahme der ersten Polynom der Funktion, (1 - Summe Alphai Li) hat eine einheitliche Wurzel der Multiplizität d. Wir können es dann folgendermaßen umschreiben: Das ARIMA - Modell drückt die Polynomfaktorisierung mit pp - d aus und gibt uns: (1 - Summe phii Li) (1 - L) d Xt (1 Summe thetai Li) varepsilont Schließlich verallgemeinern wir die Modell weiter durch Hinzufügen eines Drift-Termes, der das ARIMA-Modell als ARIMA (p, d, q) mit Drift frac definiert. (1 - Summe Phii Li) (1 - L) d Xt Delta (1 Summe thetai Li) varepsilont Mit dem nun definierten Modell können wir das ARIMA Modell als zwei getrennte Teile ansehen, ein nicht stationäres und das andere weitgehend stationär (Gemeinsame Wahrscheinlichkeitsverteilung ändert sich nicht, wenn sie in Zeit oder Raum verschoben wird). Das nicht-stationäre Modell: Das weitläufige stationäre Modell: (1 - sum phii Li) Yt (1 sum thetai Li) varepsilont Prognosen können nun auf Yt mit einer generalisierten autoregressiven Prognosemethode gemacht werden. Nun, da wir die ARMA - und ARIMA-Modelle besprochen haben, wenden wir uns nun an, wie können wir sie in praktischen Anwendungen nutzen, um eine Prognose zu liefern. Ive baute eine Implementierung mit Excel mit R, um ARIMA-Prognosen sowie eine Option zum Ausführen von Monte Carlo Simulation auf dem Modell, um die Wahrscheinlichkeit der Prognosen zu bestimmen. Excel-Implementierung und Gebrauchsanweisung Bevor Sie das Blatt verwenden, müssen Sie R und RExcel von der Statconn-Website herunterladen. Wenn du bereits R installiert hast, kannst du einfach RExcel herunterladen. Wenn du nicht R installiert hast, kannst du RAndFriends herunterladen, die die neueste Version von R und RExcel enthält. Bitte beachten Sie, dass RExcel nur auf 32bit Excel für seine nicht kommerzielle Lizenz funktioniert. Wenn Sie 64bit Excel installiert haben, müssen Sie eine kommerzielle Lizenz von Statconn erhalten. Es empfiehlt sich, RAndFriends herunterzuladen, da es für die schnellste und einfachste Installation funktioniert, wenn Sie bereits R haben und es manuell installieren möchten, folgen Sie diesen nächsten Schritten. Manuelles Installieren von RExcel Um RExcel und die anderen Pakete zu installieren, um R in Excel zu arbeiten, öffnen Sie zuerst R als Administrator, indem Sie mit der rechten Maustaste auf die. exe klicken. Installieren Sie in der R-Konsole RExcel, indem Sie die folgenden Anweisungen eingeben: Die obigen Befehle installieren RExcel auf Ihrem Computer. Der nächste Schritt ist, rcom zu installieren, das ist ein anderes Paket von Statconn für das RExcel Paket. Um dies zu installieren, geben Sie die folgenden Befehle ein, die auch rscproxy ab R Version 2.8.0 automatisch installieren. Mit diesen Paketen können Sie auf die Verbindung zwischen R und Excel setzen. Obwohl nicht notwendig, um die Installation, ein praktisches Paket zum Download ist Rcmdr, von John Fox entwickelt. Rcmdr erstellt R-Menüs, die in Excel zu Menüs werden können. Diese Funktion kommt standardmäßig mit der RAndFriends-Installation und macht mehrere R-Befehle in Excel verfügbar. Geben Sie die folgenden Befehle in R ein, um Rcmdr zu installieren. Wir können den Link zu R und Excel erstellen. Hinweis in den letzten Versionen von RExcel wird diese Verbindung mit einem einfachen Doppelklick auf die mitgelieferte. bat-Datei ActivateRExcel2010 gemacht, also musst du nur diese Schritte befolgen, wenn du R und RExcel manuell installiert hast oder wenn aus irgendeinem Grund die Verbindung nicht gemacht wird Die RAndFriends Installation. Erstellen Sie die Verbindung zwischen R und Excel Öffnen Sie ein neues Buch in Excel und navigieren Sie zum Optionsbildschirm. Klicken Sie auf Optionen und dann auf Add-Ins. Sie sollten eine Liste aller aktiven und inaktiven Add-Ins sehen, die Sie derzeit haben. Klicken Sie unten auf die Schaltfläche Go. Im Dialogfeld Add-Ins sehen Sie alle hinzugefügten Add-In-Referenzen. Klicken Sie auf Durchsuchen. Navigieren Sie zum RExcel-Ordner, der sich normalerweise in C: Program FilesRExcelxls befindet oder ähnliches. Finde das RExcel. xla-Add-In und klicke darauf. Der nächste Schritt ist, eine Referenz zu erstellen, damit Makros mit R richtig funktionieren. Geben Sie in Ihrem Excel-Dokument Alt F11 ein. Dies wird eröffnet Excels VBA Editor. Gehen Sie zu Tools - gt Referenzen, und finden Sie die RExcel-Referenz, RExcelVBAlib. RExcel sollte nun bereit sein, mit dem Excel-Blatt zu verwenden Nun, da R und RExcel richtig konfiguriert sind, ist es Zeit, eine Vorhersage zu machen. Öffnen Sie das Prognoseblatt und klicken Sie auf Server laden. Dies ist, um den RCom-Server zu starten und auch die notwendigen Funktionen zu laden, um die Prognose zu machen. Es öffnet sich ein Dialogfenster. Wählen Sie die mitgelieferte Datei itall. R aus. Diese Datei enthält die Funktionen, die das Prognosetool verwendet. Die meisten der enthaltenen Funktionen wurden von Professor Stoffer an der University of Pittsburgh entwickelt. Sie erweitern die Fähigkeiten von R und geben uns einige hilfreiche Diagnosegraphen zusammen mit unserer Prognoseleistung. Es gibt auch eine Funktion, um automatisch die passenden Parameter des ARIMA-Modells zu bestimmen. Nachdem der Server geladen ist, geben Sie Ihre Daten in die Spalte Daten ein. Markieren Sie den Bereich der Daten, klicken Sie mit der rechten Maustaste und wählen Sie Name Bereich. Benennen Sie den Bereich als Daten. Als nächstes legen Sie die Häufigkeit Ihrer Daten in Cell C6 fest. Frequenz bezieht sich auf die Zeiträume Ihrer Daten. Wenn es wöchentlich ist, wäre die Frequenz 7. Monatlich wäre 12, während vierteljährlich 4 sein würde, und so weiter. Geben Sie die voraussichtlichen Fristen ein. Beachten Sie, dass ARIMA-Modelle nach einigen aufeinanderfolgenden Frequenzvorhersagen ziemlich ungenau werden. Eine gute Faustregel ist, nicht mehr als 30 Stufen zu überschreiten, da irgendetwas vorbei, was ziemlich unzuverlässig sein könnte. Das hängt auch von der Größe Ihres Datensatzes ab. Wenn Sie über begrenzte Daten verfügen, empfiehlt es sich, eine kleinere Vorstufe zu wählen. Nach der Eingabe Ihrer Daten, der Benennung und der Einstellung der gewünschten Frequenz und der Vorhersage der Vorhersage klicken Sie auf Ausführen. Es kann eine Weile dauern, bis die Prognose verarbeitet wird. Sobald es fertig ist, erhalten Sie vorhergesagte Werte auf die angegebene Nummer, den Standardfehler der Ergebnisse und zwei Diagramme. Die linke ist die vorhergesagten Werte, die mit den Daten gezeichnet sind, während das Recht eine praktische Diagnostik mit standardisierten Residuen, die Autokorrelation der Residuen, ein gg-Plot der Residuen und ein Ljung-Box-Statistikgraphen enthält, um festzustellen, ob das Modell gut passt. Ich werde nicht zu viel Detail auf, wie Sie für ein gut ausgestattetes Modell suchen, aber auf dem ACF-Diagramm wollen Sie nicht, dass irgendwelche (oder viel) der Lag Spikes über die gepunktete blaue Linie überqueren. Auf der gg-Handlung, je mehr Kreise, die durch die Linie gehen, desto normaler und besser passt das Modell ist. Für größere Datensätze könnte dies eine Menge Kreise überqueren. Schließlich ist der Ljung-Box-Test ein Artikel an sich, aber je mehr Kreise, die über der punktierten blauen Linie liegen, desto besser ist das Modell. Wenn das Diagnoseergebnis nicht gut aussieht, können Sie versuchen, weitere Daten hinzuzufügen oder an einem anderen Punkt näher an den Bereich zu gehen, den Sie prognostizieren möchten. Sie können die erzeugten Ergebnisse ganz einfach löschen, indem Sie auf die Schaltflächen Clear Forecastted Values klicken. Und das ist es derzeit, die Datum Spalte tut nichts anderes als für Ihre Referenz, aber es ist nicht notwendig für das Tool. Wenn ich Zeit finde, komme ich zurück und füge hinzu, dass der angezeigte Graph die richtige Zeit zeigt. Sie können auch einen Fehler beim Ausführen der Prognose erhalten. Dies ist in der Regel aufgrund der Funktion, die findet die besten Parameter ist nicht in der Lage, die richtige Reihenfolge zu bestimmen. Sie können die oben genannten Schritte zu versuchen, um Ihre Daten besser für die Funktion zu arbeiten. Ich hoffe du bekommst die Verwendung aus dem Werkzeug. Es hat mir viel Zeit bei der Arbeit gerettet, denn jetzt muss ich nur noch die Daten eingeben, den Server laden und ausführen. Ich hoffe auch, dass dies zeigt, wie ehrfürchtiges R sein kann, besonders wenn es mit einem Front-End wie Excel benutzt wird. Code, Excel-Arbeitsblatt und. bas-Datei sind auch hier auf GitHub. Autoregressive Moving-Average-Fehlerprozesse (ARMA-Fehler) und andere Modelle, die Verzögerungen von Fehlerbegriffen beinhalten, können mit Hilfe von FIT-Anweisungen geschätzt und mit SOLVE-Anweisungen simuliert oder prognostiziert werden. ARMA-Modelle für den Fehlerprozess werden oft für Modelle mit autokorrelierten Resten verwendet. Das AR-Makro kann verwendet werden, um Modelle mit autoregressiven Fehlerprozessen festzulegen. Das MA-Makro kann verwendet werden, um Modelle mit gleitenden durchschnittlichen Fehlerprozessen zu spezifizieren. Autoregressive Fehler Ein Modell mit Autoregressivfehlern erster Ordnung, AR (1), hat die Form, während ein AR (2) Fehlerprozess die Form und so weiter für höherwertige Prozesse hat. Beachten Sie, dass die s unabhängig und identisch verteilt sind und einen erwarteten Wert von 0 haben. Ein Beispiel für ein Modell mit einer AR (2) - Komponente ist und so weiter für höherwertige Prozesse. Zum Beispiel können Sie ein einfaches lineares Regressionsmodell mit MA (2) gleitenden Durchschnittsfehlern schreiben, da MA1 und MA2 die gleitenden Durchschnittsparameter sind. Beachten Sie, dass RESID. Y automatisch von PROC MODEL definiert wird. Die ZLAG-Funktion muss für MA-Modelle verwendet werden, um die Rekursion der Verzögerungen abzuschneiden. Damit wird sichergestellt, dass die verzögerten Fehler in der Lag-Priming-Phase bei Null beginnen und bei fehlenden Fehlern keine fehlenden Werte ausbreiten, und es stellt sicher, dass die zukünftigen Fehler null sind, anstatt während der Simulation oder Prognose zu fehlen. Einzelheiten zu den Lag-Funktionen finden Sie im Abschnitt Lag Logic. Dieses Modell, das mit dem MA-Makro geschrieben wurde, lautet wie folgt: Allgemeines Formular für ARMA-Modelle Das allgemeine ARMA (p, q) - Verfahren hat folgendes Formular Ein ARMA (p, q) - Modell kann wie folgt angegeben werden: wobei AR i und MA j repräsentieren Die autoregressiven und gleitenden Durchschnittsparameter für die verschiedenen Verzögerungen. Sie können alle Namen, die Sie für diese Variablen wollen, und es gibt viele gleichwertige Möglichkeiten, dass die Spezifikation geschrieben werden könnte. Vektor-ARMA-Prozesse können auch mit PROC MODEL geschätzt werden. Beispielsweise kann ein zwei-variables AR (1) - Verfahren für die Fehler der beiden endogenen Variablen Y1 und Y2 wie folgt spezifiziert werden: Konvergenzprobleme mit ARMA-Modellen ARMA-Modelle können schwer abzuschätzen sein. Wenn die Parameterschätzungen nicht innerhalb des entsprechenden Bereichs liegen, wachsen ein gleitender Durchschnittsrestbestand exponentiell. Die berechneten Residuen für spätere Beobachtungen können sehr groß sein oder überlaufen. Dies kann entweder geschehen, weil falsche Startwerte verwendet wurden oder weil die Iterationen von vernünftigen Werten entfernt wurden. Bei der Auswahl von Startwerten für ARMA-Parameter sollte die Pflege verwendet werden. Startwerte von 0,001 für ARMA-Parameter funktionieren in der Regel, wenn das Modell die Daten gut passt und das Problem gut konditioniert ist. Beachten Sie, dass ein MA-Modell oft durch ein höheres AR-Modell angenähert werden kann und umgekehrt. Dies kann zu einer hohen Kollinearität in gemischten ARMA-Modellen führen, was wiederum eine ernsthafte Konditionierung in den Berechnungen und Instabilitäten der Parameterschätzungen verursachen kann. Wenn Sie Konvergenzprobleme haben, während Sie ein Modell mit ARMA-Fehlerprozessen abschätzen, versuchen Sie es in Schritten zu schätzen. Zuerst verwenden Sie eine FIT-Anweisung, um nur die strukturellen Parameter mit den ARMA-Parametern auf Null (oder vernünftige vorherige Schätzungen falls vorhanden) abzuschätzen. Als nächstes verwenden Sie eine andere FIT-Anweisung, um die ARMA-Parameter nur mit den strukturellen Parameterwerten aus dem ersten Lauf zu schätzen. Da die Werte der Strukturparameter wahrscheinlich nahe an ihren endgültigen Schätzungen liegen, können die ARMA-Parameter-Schätzungen nun konvergieren. Schließlich verwenden Sie eine andere FIT-Anweisung, um simultane Schätzungen aller Parameter zu erzeugen. Da die Anfangswerte der Parameter nun wahrscheinlich ganz nahe bei ihren endgültigen gemeinsamen Schätzungen liegen, sollten die Schätzungen schnell konvergieren, wenn das Modell für die Daten geeignet ist. AR Anfangsbedingungen Die anfänglichen Verzögerungen der Fehlerausdrücke von AR (p) - Modellen können auf unterschiedliche Weise modelliert werden. Die autoregressiven Fehlerstartmethoden, die von SASETS-Prozeduren unterstützt werden, sind die folgenden: bedingte kleinste Quadrate (ARIMA - und MODELL-Prozeduren) bedingungslose kleinste Quadrate (AUTOREG-, ARIMA - und MODELL-Prozeduren) maximale Wahrscheinlichkeit (AUTOREG-, ARIMA - und MODELL-Prozeduren) Yule-Walker (AUTOREG Vorgehensweise) Hildreth-Lu, der die ersten P-Beobachtungen löscht (nur MODEL-Verfahren) Siehe Kapitel 8, Das AUTOREG-Verfahren für eine Erläuterung und Diskussion der Vorzüge verschiedener AR (p) Startmethoden. Die CLS-, ULS-, ML - und HL-Initialisierungen können von PROC MODEL durchgeführt werden. Bei AR (1) Fehlern können diese Initialisierungen wie in Tabelle 18.2 gezeigt hergestellt werden. Diese Methoden sind in großen Proben äquivalent. Tabelle 18.2 Initialisierungen von PROC MODEL: AR (1) FEHLER Die anfänglichen Verzögerungen der Fehlerterme von MA (q) Modellen können auch auf unterschiedliche Weise modelliert werden. Die folgenden gleitenden durchschnittlichen Fehler-Start-up-Paradigmen werden von den ARIMA - und MODEL-Prozeduren unterstützt: bedingungslose kleinste Quadrate bedingte kleinste Quadrate Die bedingte Methode der kleinsten Quadrate, um gleitende durchschnittliche Fehlerbegriffe zu schätzen, ist nicht optimal, da sie das Start-Problem ignoriert. Dies verringert die Effizienz der Schätzungen, obwohl sie selbständig bleiben. Die anfänglichen verzögerten Residuen, die sich vor dem Start der Daten erstrecken, werden als 0 angenommen, ihr unbedingter Erwartungswert. Dies führt zu einem Unterschied zwischen diesen Residuen und den verallgemeinerten kleinsten Quadraten-Resten für die gleitende Durchschnittskovarianz, die im Gegensatz zum autoregressiven Modell durch den Datensatz bestehen bleibt. Normalerweise konvergiert diese Differenz schnell auf 0, aber für fast nicht umwandelbare gleitende Mittelprozesse ist die Konvergenz ziemlich langsam. Um dieses Problem zu minimieren, sollten Sie genügend Daten haben, und die gleitenden durchschnittlichen Parameterschätzungen sollten innerhalb des invertierbaren Bereichs liegen. Dieses Problem kann auf Kosten des Schreibens eines komplexeren Programms korrigiert werden. Unbedingte kleinste Quadrate Schätzungen für die MA (1) Prozess kann durch die Angabe des Modells wie folgt produziert werden: Moving-Average-Fehler können schwer abzuschätzen. Sie sollten eine AR (p) - Animation an den gleitenden Mittelprozess anwenden. Ein gleitender Durchschnittsprozess kann in der Regel durch einen autoregressiven Prozess gut angenähert werden, wenn die Daten nicht geglättet oder differenziert wurden. Das AR-Makro Das SAS-Makro AR erzeugt Programmieranweisungen für PROC MODEL für autoregressive Modelle. Das AR-Makro ist Teil der SASETS-Software und es sind keine speziellen Optionen erforderlich, um das Makro zu verwenden. Der autoregressive Prozess kann auf die strukturellen Gleichungsfehler oder auf die endogene Reihe selbst angewendet werden. Das AR-Makro kann für die folgenden Autoregressionstypen verwendet werden: uneingeschränkte Vektorautoregression eingeschränkte Vektorautoregression Univariate Autoregression Um den Fehlerterm einer Gleichung als autoregressiven Prozess zu modellieren, verwenden Sie nach der Gleichung die folgende Aussage: Angenommen, Y ist ein Lineare Funktion von X1, X2 und einem AR (2) Fehler. Sie würden dieses Modell wie folgt schreiben: Die Anrufe nach AR müssen nach allen Gleichungen kommen, auf die der Prozess zutrifft. Der vorangehende Makroaufruf, AR (y, 2), erzeugt die in der LIST-Ausgabe in Abbildung 18.58 dargestellten Anweisungen. Abbildung 18.58 LIST Option Ausgang für ein AR (2) - Modell Die PRED-vordefinierten Variablen sind temporäre Programmvariablen, so dass die Verzögerungen der Residuen die korrekten Residuen sind und nicht die durch diese Gleichung neu definierten. Beachten Sie, dass dies den Aussagen entspricht, die explizit im Abschnitt Allgemeine Formular für ARMA-Modelle geschrieben sind. Sie können die autoregressiven Parameter auch bei ausgewählten Lags auf Null setzen. Wenn Sie z. B. autoregressive Parameter bei den Ziffern 1, 12 und 13 wünschen, können Sie die folgenden Aussagen verwenden: Diese Aussagen erzeugen die in Abbildung 18.59 dargestellte Ausgabe. Abbildung 18.59 LIST Option Ausgang für ein AR-Modell mit Lags bei 1, 12 und 13 Das MODEL Procedure Listing von Compiled Program Code Statement als Parsed PRED. yab x1 c x2 RESID. y PRED. y - ACTUAL. y ERROR. Y PRED. Y - y OLDPRED. y PRED. y yl1 ZLAG1 (y - perdy) yl12 ZLAG12 (y - perdy) yl13 ZLAG13 (y - perdy) RESID. y PRED. y - ACTUAL. y ERROR. Y PRED. y - y Es gibt Variationen der bedingten Methode der kleinsten Quadrate, je nachdem, ob Beobachtungen zu Beginn der Serie zum Aufwärmen des AR-Prozesses verwendet werden. Standardmäßig verwendet die AR-bedingte Methode der kleinsten Quadrate alle Beobachtungen und nimmt Nullen für die anfänglichen Verzögerungen autoregressiver Begriffe an. Durch die Verwendung der M-Option können Sie anfordern, dass AR die unbedingte Methode der kleinsten Quadrate (ULS) oder Maximum-Likelihood (ML) verwendet. Zum Beispiel finden die Diskussionen dieser Methoden im Abschnitt AR Anfangsbedingungen. Mit der Option MCLS n können Sie anfordern, dass die ersten n Beobachtungen verwendet werden, um Schätzungen der ursprünglichen autoregressiven Verzögerungen zu berechnen. In diesem Fall beginnt die Analyse mit der Beobachtung n 1. Zum Beispiel: Mit dem AR-Makro können Sie mit der Option TYPEV ein autoregressives Modell an die endogene Variable anstelle des Fehlerbegriffs anwenden. Wenn Sie zum Beispiel die fünf vergangenen Verzögerungen von Y der Gleichung im vorherigen Beispiel hinzufügen möchten, können Sie mit AR die Parameter und Verzögerungen verwenden, indem Sie die folgenden Anweisungen verwenden: Die vorherigen Anweisungen erzeugen die in Abbildung 18.60 dargestellte Ausgabe. Abbildung 18.60 LIST Option Ausgang für ein AR-Modell von Y Dieses Modell prognostiziert Y als lineare Kombination von X1, X2, einem Intercept und den Werten von Y in den letzten fünf Perioden. Unbeschränkte Vektor-Autoregression Um die Fehlerterme eines Satzes von Gleichungen als autoregressiver Autorektor zu modellieren, verwenden Sie nach den Gleichungen die folgende Form des AR-Makros: Der Prozeßname-Wert ist ein beliebiger Name, den Sie für AR verwenden, um Namen für den autoregressiven zu verwenden Parameter. Sie können das AR-Makro verwenden, um mehrere verschiedene AR-Prozesse für verschiedene Sätze von Gleichungen zu modellieren, indem Sie für jeden Satz unterschiedliche Prozessnamen verwenden. Der Prozessname stellt sicher, dass die verwendeten Variablennamen eindeutig sind. Verwenden Sie einen kurzen Prozessnamenwert für den Prozess, wenn Parameterschätzungen in einen Ausgabedatensatz geschrieben werden sollen. Das AR-Makro versucht, Parameternamen zu erstellen, die kleiner oder gleich acht Zeichen sind, aber dies ist durch die Länge des Prozessnamens begrenzt. Die als Präfix für die AR-Parameternamen verwendet wird. Der Variablenwert ist die Liste der endogenen Variablen für die Gleichungen. Angenommen, dass Fehler für die Gleichungen Y1, Y2 und Y3 durch einen autoregressiven Prozess zweiter Ordnung erzeugt werden. Sie können die folgenden Aussagen verwenden, die für Y1 und einen ähnlichen Code für Y2 und Y3 generieren: Für die Vektorprozesse kann nur die Methode der bedingten kleinsten Quadrate (MCLS oder MCLS n) verwendet werden. Sie können auch das gleiche Formular mit Einschränkungen verwenden, dass die Koeffizientenmatrix bei ausgewählten Lags 0 ist. Zum Beispiel geben die folgenden Aussagen einen Vektorprozess dritter Ordnung an die Gleichungsfehler mit allen Koeffizienten bei Verzögerung 2, die auf 0 beschränkt ist, und mit den Koeffizienten bei Verzögerungen 1 und 3 uneingeschränkt: Sie können die drei Serien Y1Y3 als Vektor autoregressiven Prozess modellieren In den Variablen statt in den Fehlern mit der Option TYPEV. Wenn du Y1Y3 als Funktion von vergangenen Werten von Y1Y3 und einigen exogenen Variablen oder Konstanten modellieren möchtest, kannst du mit AR die Aussagen für die Verzögerungsbedingungen erzeugen. Schreiben Sie für jede Variable eine Gleichung für den nichtautoregressiven Teil des Modells und rufen Sie dann AR mit der Option TYPEV auf. Zum Beispiel kann der nichtautoregressive Teil des Modells eine Funktion von exogenen Variablen sein, oder es können Abschnittsparameter sein. Wenn es keine exogenen Komponenten für das Vektor-Autoregression-Modell gibt, einschließlich keine Abschnitte, dann ordnen Sie jeder der Variablen Null zu. Es muss eine Zuordnung zu jeder der Variablen geben, bevor AR aufgerufen wird. Dieses Beispiel modelliert den Vektor Y (Y1 Y2 Y3) als lineare Funktion nur seines Wertes in den vorherigen zwei Perioden und einen weißen Rauschfehlervektor. Das Modell hat 18 (3 3 3 3) Parameter. Syntax des AR-Makros Es gibt zwei Fälle der Syntax des AR-Makros. Wenn keine Beschränkungen für einen Vektor-AR-Prozess erforderlich sind, gibt die Syntax des AR-Makros das allgemeine Formular ein Präfix für AR, das beim Erstellen von Namen von Variablen verwendet wird, die benötigt werden, um den AR-Prozess zu definieren. Wenn der Endolist nicht angegeben ist, wird die endogene Liste standardmäßig benannt. Die der Name der Gleichung sein muss, auf die der AR-Fehlerprozess angewendet werden soll. Der Name Wert darf 32 Zeichen nicht überschreiten. Ist die Reihenfolge des AR-Prozesses. Gibt die Liste der Gleichungen an, auf die der AR-Prozess angewendet werden soll. Wenn mehr als ein Name gegeben ist, wird ein uneingeschränkter Vektorprozess mit den strukturellen Resten aller Gleichungen erzeugt, die als Regressoren in jeder der Gleichungen enthalten sind. Wenn nicht angegeben, wird endolist standardmäßig benannt. Gibt die Liste der Verzögerungen an, an denen die AR-Begriffe hinzugefügt werden sollen. Die Koeffizienten der Terme, die nicht aufgeführt sind, werden auf 0 gesetzt. Alle aufgeführten Lags müssen kleiner oder gleich nlag sein. Und es muss keine Duplikate geben. Wenn nicht angegeben, wird die Laglist standardmäßig auf alle Verzögerungen 1 bis nlag gesetzt. Legt die zu implementierende Schätzmethode fest. Gültige Werte von M sind CLS (bedingte kleinste Quadrate Schätzungen), ULS (unbedingte kleinste Quadrate Schätzungen) und ML (Maximum Likelihood Schätzungen). MCLS ist die Voreinstellung. Nur MCLS ist erlaubt, wenn mehr als eine Gleichung angegeben ist. Die ULS - und ML-Methoden werden für AR-Modelle von AR nicht unterstützt. Dass der AR-Prozess auf die endogenen Variablen selbst anstatt auf die strukturellen Residuen der Gleichungen angewendet werden soll. Eingeschränkte Vektor-Autoregression Sie können steuern, welche Parameter in den Prozess aufgenommen werden, und beschränken auf 0 die Parameter, die Sie nicht enthalten. Zuerst verwenden Sie AR mit der Option DEFER, um die Variablenliste zu deklarieren und die Dimension des Prozesses zu definieren. Verwenden Sie dann zusätzliche AR-Aufrufe, um Begriffe für ausgewählte Gleichungen mit ausgewählten Variablen an ausgewählten Lags zu erzeugen. Zum Beispiel sind die erzeugten Fehlergleichungen wie folgt: Dieses Modell besagt, dass die Fehler für Y1 von den Fehlern von Y1 und Y2 (aber nicht Y3) an beiden Verzögerungen 1 und 2 abhängen und dass die Fehler für Y2 und Y3 davon abhängen Die vorherigen Fehler für alle drei Variablen, aber nur bei Verzögerung 1. AR-Makro-Syntax für eingeschränkte Vektor-AR Eine alternative Verwendung von AR erlaubt es, Einschränkungen für einen Vektor-AR-Prozess aufzuerlegen, indem man AR mehrmals aufruft, um verschiedene AR-Terme und Verzögerungen für verschiedene anzugeben Gleichungen. Der erste Aufruf hat das allgemeine Formular spezifiziert ein Präfix für AR, das beim Erstellen von Namen von Variablen verwendet wird, die benötigt werden, um den Vektor-AR-Prozess zu definieren. Gibt die Reihenfolge des AR-Prozesses an. Gibt die Liste der Gleichungen an, auf die der AR-Prozess angewendet werden soll. Gibt an, dass AR nicht den AR-Prozess generieren soll, sondern auf weitere Informationen warten muss, die in späteren AR-Aufrufen für denselben Namenswert angegeben sind. Die nachfolgenden Anrufe haben die allgemeine Form ist die gleiche wie im ersten Aufruf. Gibt die Liste der Gleichungen an, auf die die Spezifikationen dieses AR-Aufrufs angewendet werden sollen. Nur Namen, die im endolistischen Wert des ersten Aufrufs für den Namen Wert angegeben sind, können in der Liste der Gleichungen in der eqlist erscheinen. Spezifiziert die Liste der Gleichungen, deren verzögerte strukturelle Residuen als Regressoren in den Gleichungen in eqlist aufgenommen werden sollen. Nur Namen im Endolisten des ersten Aufrufs für den Namenswert können in varlist erscheinen. Wenn nicht angegeben, varlist standardmäßig endolist. Gibt die Liste der Verzögerungen an, an denen die AR-Begriffe hinzugefügt werden sollen. Die Koeffizienten der Terme, die nicht aufgeführt sind, werden auf 0 gesetzt. Alle aufgeführten Lags müssen kleiner oder gleich dem Wert von nlag sein. Und es muss keine Duplikate geben. Wenn nicht angegeben, wird die Laglist standardmäßig auf alle Verzögerungen 1 bis nlag gesetzt. Das MA-Makro Das SAS-Makro MA generiert Programmierungsanweisungen für PROC MODEL für gleitende Durchschnittsmodelle. Das MA-Makro ist Teil der SASETS-Software und es sind keine speziellen Optionen erforderlich, um das Makro zu verwenden. Der gleitende durchschnittliche Fehlerprozess kann auf die strukturellen Gleichungsfehler angewendet werden. Die Syntax des MA-Makros ist das gleiche wie das AR-Makro, außer es gibt kein TYPE-Argument. Wenn Sie die MA - und AR-Makros kombinieren, muss das MA-Makro dem AR-Makro folgen. Die folgenden SASIML-Anweisungen erzeugen einen ARMA (1, (1 3)) Fehlerprozess und speichern ihn im Datensatz MADAT2. Die folgenden PROC MODEL-Anweisungen werden verwendet, um die Parameter dieses Modells mit Hilfe der Maximum-Likelihood-Fehlerstruktur zu schätzen: Die Schätzungen der Parameter, die durch diesen Lauf erzeugt werden, sind in Abbildung 18.61 dargestellt. Abbildung 18.61 Schätzungen aus einem ARMA (1, (1 3)) Prozess Es gibt zwei Fälle der Syntax für das MA-Makro. Wenn Einschränkungen für einen Vektor-MA-Prozess nicht benötigt werden, gibt die Syntax des MA-Makros das allgemeine Formular ein Präfix für MA an, das beim Erstellen von Namen von Variablen verwendet wird, die benötigt werden, um den MA-Prozess zu definieren und ist der Standard-Endolist. Ist die Reihenfolge des MA-Prozesses. Gibt die Gleichungen an, auf die der MA-Prozess angewendet werden soll. Wenn mehr als ein Name angegeben ist, wird die CLS-Schätzung für den Vektorprozess verwendet. Gibt die Verzögerungen an, bei denen die MA-Bedingungen hinzugefügt werden sollen. Alle aufgeführten Lags müssen kleiner oder gleich nlag sein. Und es muss keine Duplikate geben. Wenn nicht angegeben, wird die Laglist standardmäßig auf alle Verzögerungen 1 bis nlag gesetzt. Legt die zu implementierende Schätzmethode fest. Gültige Werte von M sind CLS (bedingte kleinste Quadrate Schätzungen), ULS (unbedingte kleinste Quadrate Schätzungen) und ML (Maximum Likelihood Schätzungen). MCLS ist die Voreinstellung. Nur MCLS ist erlaubt, wenn im Endolisten mehr als eine Gleichung angegeben ist. MA Makro-Syntax für eingeschränkte Vektor-Moving-Average Eine alternative Verwendung von MA erlaubt es, Einschränkungen für einen Vektor-MA-Prozess aufzuerlegen, indem man MA mehrmals aufruft, um verschiedene MA-Terme anzugeben und für verschiedene Gleichungen zu verzögern. Der erste Aufruf hat das allgemeine Formular spezifiziert ein Präfix für MA, das beim Erstellen von Namen von Variablen verwendet wird, die benötigt werden, um den Vektor-MA-Prozess zu definieren. Gibt die Reihenfolge des MA-Prozesses an. Gibt die Liste der Gleichungen an, auf die der MA-Prozess angewendet werden soll. Gibt an, dass MA nicht den MA-Prozess generieren soll, sondern auf weitere Informationen warten muss, die in späteren MA-Aufrufen für denselben Namenswert angegeben sind. Die nachfolgenden Anrufe haben die allgemeine Form ist die gleiche wie im ersten Aufruf. Gibt die Liste der Gleichungen an, auf die die Spezifikationen dieses MA-Aufrufs angewendet werden sollen. Spezifiziert die Liste der Gleichungen, deren verzögerte strukturelle Residuen als Regressoren in den Gleichungen in eqlist aufgenommen werden sollen. Spezifiziert die Liste der Verzögerungen, an denen die MA-Terme hinzugefügt werden sollen. Autoregressive Moving-Average Simulation (First Order) Die Demonstration ist so eingestellt, dass die gleiche zufällige Reihe von Punkten verwendet wird, egal wie die Konstanten und variiert sind. Wenn jedoch die Taste quotrandomizequot gedrückt wird, wird eine neue Zufallsreihe erzeugt und verwendet. Wenn man die zufällige Serie identifiziert, kann der Benutzer genau die Effekte auf die ARMA-Reihe von Änderungen in den beiden Konstanten sehen. Die Konstante ist auf (-1,1) begrenzt, da sich die Divergenz der ARMA-Serie ergibt. Die Demonstration ist nur für einen ersten Auftrag. Zusätzliche AR-Begriffe würden es ermöglichen, komplexere Serien zu erzeugen, während zusätzliche MA-Begriffe die Glättung erhöhen würden. Für eine detaillierte Beschreibung der ARMA-Prozesse siehe z. B. G. Box, G. M. Jenkins und G. Reinsel, Zeitreihenanalyse: Prognose und Kontrolle. 3. Aufl. Englewood Cliffs, NJ: Prentice-Hall, 1994. RELATED LINKSDokumentation dfilt. latticearma Am wichtigsten ist die Etikettenposition im Diagramm, die angibt, wo das Format gilt. Als Beispiel betrachten wir das Etikett LatticeProdFormat, das immer einem Koeffizienten-Multiplikationselement im Signalfluss folgt. Das Etikett zeigt an, dass Gitterkoeffizienten das Multiplikationselement mit der Wortlänge und Bruchlänge verlassen, die mit Produktoperationen verbunden sind, die Koeffizienten enthalten. Von der Überprüfung der Tabelle sehen Sie, dass die LatticeProdFormat auf die Eigenschaften ProductWordLength verweist. LatticeProdFracLength. Und ProductMode, die das Koeffizientenformat nach Multiplikations - (oder Produkt-) Operationen vollständig definieren. Eigenschaften In dieser Tabelle sehen Sie die Eigenschaften, die mit der autoregressiven gleitenden Gitterimplementierung von dfilt-Objekten verknüpft sind. Hinweis Die Tabelle listet alle Eigenschaften auf, die ein Filter haben kann. Viele der Eigenschaften sind dynamisch, dh sie existieren nur in Reaktion auf die Einstellungen anderer Eigenschaften. Sie sehen nicht alle aufgeführten Eigenschaften die ganze Zeit. Um alle Eigenschaften für einen Filter jederzeit anzuzeigen, verwenden Sie, wo hd ein Filter ist. Weitere Informationen über die Eigenschaften dieses Filters oder eines beliebigen dfilt-Objekts finden Sie unter Fixpunktfiltereigenschaften. Setzt den Modus, der verwendet wird, um auf Überlaufbedingungen in Fixpunkt-Arithmetik zu reagieren. Wählen Sie entweder Sättigung (Begrenzung der Ausgabe auf den größten positiven oder negativen repräsentativen Wert) oder wickeln Sie (überströmende Werte auf den nächsten repräsentablen Wert mit modularer Arithmetik setzen). Die Wahl, die Sie treffen, wirkt sich nur auf den Akkumulator und die Arithmetik aus. Koeffizient und Eingabe Arithmetik immer gesättigt. Schließlich überholen die Produkte niemals die volle Präzision. Für die Ausgabe aus einer Produktoperation legt dies die Bruchlänge fest, die zur Interpretation der Daten verwendet wird. Diese Eigenschaft wird beschreibbar (Sie können den Wert ändern), wenn Sie ProductMode auf SpecifyPrecision setzen. Legt fest, wie der Filter die Ausgabe von Produktoperationen verarbeitet. Wählen Sie aus Vollpräzision (FullPrecision) oder ob Sie das signifikanteste Bit (KeepMSB) oder das niedrigstwertige Bit (KeepLSB) im Ergebnis behalten, wenn Sie die Datenworte verkürzen müssen. Damit Sie die Präzision (die Bruchlänge), die von der Ausgabe aus den Multiplikationen verwendet wird, festlegen können, setzen Sie ProductMode auf SpecifyPrecision. Gibt die Wortlänge an, die für Multiplikationsoperationsergebnisse verwendet werden soll. Diese Eigenschaft wird beschreibbar (Sie können den Wert ändern), wenn Sie ProductMode auf SpecifyPrecision setzen. Gibt an, ob die Filterzustände und der Speicher vor jedem Filtervorgang zurückgesetzt werden sollen. Ermöglicht es Ihnen, zu entscheiden, ob Ihr Filter die Zustände von früheren Filterläufen behält. False ist die Standardeinstellung. Setzt den Modus, den der Filter verwendet, um numerische Werte zu quantisieren, wenn die Werte zwischen repräsentativen Werten für das Datenformat liegen (Wort - und Bruchlängen). Ceil - runde zur positiven unendlichkeit Konvergent - Runde bis zur nächsten repräsentablen Ganzzahl. Bindungen runden auf die nächstgelegene, noch gespeicherte Ganzzahl. Dies ist die am wenigsten voreingenommene Methode, die in dieser Software verfügbar ist. Fix - runde gegen null Boden - Rund in Richtung der Unendlichkeit. Nächstes - Rund zum nächsten. Um eine positive Unendlichkeit Runde - Rund zum nächsten. Bindungen runden zur negativen Unendlichkeit für negative Zahlen und in Richtung der positiven Unendlichkeit für positive Zahlen. Die Wahl, die Sie treffen, wirkt sich nur auf den Akkumulator und die Arithmetik aus. Koeffizient und Eingabe Arithmetik immer rund. Schließlich, Produkte nie überlaufen 8212 sie behalten volle Präzision. Gibt an, ob der Filter signierte oder unsignierte Fixpunktkoeffizienten verwendet. Nur Koeffizienten spiegeln diese Eigenschaft wider. Wähle dein Land
No comments:
Post a Comment