Autoregressive Integrated Moving Average - ARIMA definizione di Autoregressive Integrated Moving Average - ARIMA Un modello di analisi statistica che utilizza i dati di serie storiche per prevedere le tendenze future. Si tratta di una forma di analisi di regressione che cerca di prevedere i movimenti futuri lungo la passeggiata apparentemente casuale presa da azioni e il mercato finanziario esaminando le differenze tra i valori della serie invece di utilizzare i valori effettivi dei dati. Ritardi della serie differenziata sono indicati come autoregressiva e ritardi entro i dati previsti sono indicati come media mobile. Abbattere Autoregressive Integrated Moving Average - ARIMA Questo tipo di modello è generalmente indicato come ARIMA (p, d, q), con i numeri interi che si riferiscono alla autoregressivo. integrato e parti in movimento medio del set di dati, rispettivamente. ARIMA modellazione può tener conto delle tendenze, la stagionalità. cicli, errori e degli aspetti non stazionari di un insieme di dati quando si effettuano forecasts. Autoregressive modello a media mobile ARMA (p, q) per Time Series Analysis - Parte 1 In ultimo articolo abbiamo guardato passeggiate aleatorie e rumore bianco come modelli di serie storiche di base per alcuni strumenti finanziari, come i prezzi delle azioni e su indici azionari quotidiane. Abbiamo trovato che in alcuni casi un modello random walk era insufficiente per catturare il comportamento autocorrelazione massima di strumento, che motiva modelli più sofisticati. Nel prossimo paio di articoli che ci accingiamo a discutere di tre tipi di modello, vale a dire la (AR) il modello di ordine p Autoregressive, la media mobile (MA) modello di ordine q e il misto Autogressive media mobile (ARMA) modello di ordine p , q. Questi modelli ci aiuteranno tentativo di catturare o spiegare più della correlazione seriale presente all'interno di uno strumento. In definitiva essi ci fornirà un mezzo per prevedere i prezzi futuri. Tuttavia, è ben noto che serie finanziarie possiedono una proprietà nota come la volatilità clustering. Cioè, la volatilità dello strumento non è costante nel tempo. Il termine tecnico per questo comportamento è noto come eteroschedasticità condizionale. Dal momento che l'AR, modelli MA e ARMA non sono condizionalmente eteroschedastici, cioè, essi non tengono conto della volatilità di clustering, avremo infine bisogno di un modello più sofisticato per le nostre previsioni. Tali modelli includono il modello Autogressive condizionale eteroschedastico (ARCH) e il modello generalizzate Autogressive condizionale eteroschedastico (GARCH), e loro le molte varianti. GARCH è particolarmente conosciuto in finanza quant ed è usato principalmente per le simulazioni serie finanziarie come mezzo di stima del rischio. Tuttavia, come con tutti gli articoli QuantStart, voglio costruire fino a questi modelli da versioni più semplici in modo che possiamo vedere come ogni nuova variante cambia la nostra capacità predittiva. Nonostante il fatto che AR, MA e ARMA sono relativamente semplici modelli di serie storiche, che sono la base di modelli più complessi, come il modello autoregressivo integrato a media mobile (ARIMA) e la famiglia GARCH. Quindi è importante che noi li studiamo. Una delle nostre prime strategie di trading della serie serie di articoli tempo sarà quello di coniugare ARIMA e GARCH al fine di prevedere i prezzi n periodi in anticipo. Tuttavia, dovremo aspettare fino a quando weve discusso sia ARIMA e GARCH separatamente prima di applicarli a una strategia vera e propria Come Will si procede In questo articolo ci accingiamo a delineare alcuni nuovi concetti di serie temporali che bene hanno bisogno per i metodi rimanenti, vale a dire rigorosa stazionarietà e il criterio di informazione di Akaike (AIC). A seguito di questi nuovi concetti seguiremo il modello tradizionale per lo studio di nuovi modelli di serie storica: Razionale - Il primo compito è quello di fornire un motivo per cui erano interessati ad un particolare modello, come quants. Perché stiamo introducendo il modello di serie storiche Quali effetti può catturare Cosa ci guadagno (o perdere) con l'aggiunta di complessità definizione extra - Abbiamo bisogno di fornire la definizione completa matematica (e la notazione associata) del modello di serie temporali, al fine di ridurre al minimo ogni ambiguità. Secondo Ordine Properties - si discuterà (e in alcuni casi derivano) la seconda proprietà ordine del modello di serie temporali, che comprende la sua media, la sua varianza e la sua funzione di autocorrelazione. Correlogramma - Si utilizzerà la seconda proprietà per poter tracciare un correlogramma di una realizzazione del modello di serie storica al fine di visualizzare il suo comportamento. Simulazione - Noi simulare realizzazioni del modello di serie temporali e quindi adattare il modello di queste simulazioni per assicurarci di avere implementazioni precise e comprendere il processo di adattamento. Reale dei dati finanziari - Vi adattarsi al modello di serie temporali di dati finanziari reali e considerare la correlogramma dei residui, al fine di vedere come spiega il modello per la correlazione seriale nella serie originale. Previsione - Si creerà n-passo avanti previsioni del modello di serie temporali per particolari realizzazioni, al fine di produrre in ultima analisi, segnali di trading. Quasi tutti gli articoli che scrivo sui modelli di serie storiche cadranno in questo modello e ci permetterà di confrontare agevolmente le differenze tra ogni modello come abbiamo aggiungere ulteriori complessità. Sono stati intenzione di iniziare, cercando in rigoroso stazionarietà e l'AIC. Rigorosamente stazionario Abbiamo fornito la definizione di stazionarietà in questo articolo sulla correlazione seriale. Tuttavia, perché stiamo per essere entrare nel regno di molte serie finanziaria, con varie frequenze, abbiamo bisogno di fare in modo che i nostri (eventuali) modelli prendono in considerazione la volatilità variabile nel tempo di queste serie. In particolare, dobbiamo considerare la loro eteroschedasticità. Ci si troverà di fronte questo problema quando si cerca di adattare alcuni modelli di serie storiche. In generale, non tutta la correlazione seriale nei residui di modelli a muro possono essere valutate senza tener eteroschedasticità in considerazione. Questo ci riporta alla stazionarietà. Una serie non è fermo nella varianza se ha volatilità variabile nel tempo, per definizione. Questo motiva una definizione più rigorosa di stazionarietà, ovvero rigorosa stazionarietà: rigorosamente fisso Serie Un modello di serie temporali,, è strettamente stazionario se la distribuzione statistica congiunta degli elementi x, ldots, x è la stessa di quella di XM, ldots, xm, forall ti, m. Si può pensare di questa definizione come semplicemente che la distribuzione della serie temporale è invariato per qualsiasi spostamento abritrary nel tempo. In particolare, la media e la varianza sono costanti nel tempo per una serie strettamente stazionaria e la autocovarianza tra xt e xs (diciamo) dipende solo dalla differenza assoluta di t e s, t-s. Ci sarà proposto serie strettamente stazionario nei prossimi post. Akaike Information Criterion ho accennato in articoli precedenti che avremmo alla fine dovranno prendere in considerazione come scegliere tra i migliori modelli separati. Questo è vero non solo per analisi di serie temporali, ma anche di machine learning e, più in generale, le statistiche in generale. I due metodi principali useremo (per il momento) sono il criterio di informazione di Akaike (AIC) e il criterio di informazione bayesiana (man mano che procediamo ulteriormente con i nostri articoli su bayesiana Statistics). Bene considerare brevemente l'AIC, come verrà utilizzato nella parte 2 di questo articolo ARMA. AIC è essenzialmente uno strumento per aiutare nella scelta del modello. Cioè, se abbiamo una selezione di modelli statistici (compresi serie temporale), allora l'AIC stima della qualità di ciascun modello, rispetto agli altri che abbiamo a disposizione. Si basa sulla teoria dell'informazione. che è un grande interesse argomento, profonda che purtroppo non possiamo andare troppo nel dettaglio circa. Si tenta di bilanciare la complessità del modello, che in questo caso, il numero di parametri, da quanto bene si adatta ai dati. Consente di fornire una definizione: Akaike Information Criterion Se prendiamo la funzione di verosimiglianza per un modello statistico, che ha i parametri k, e L massimizza la probabilità. allora il criterio Akaike informazioni è dato da: Il modello preferito, da una selezione di modelli, ha il minio AIC del gruppo. Si può vedere che l'AIC si sviluppa come il numero di parametri, k, aumenta, ma è ridotta se i negativi aumenta verosimiglianza. In sostanza si penalizza modelli che sono sovradattamento. Stiamo per essere la creazione di AR, MA e modelli ARMA di ordini diversi e un modo per scegliere il modello migliore adattarla a un particolare insieme di dati è quello di utilizzare l'AIC. Questo è quanto bene stia facendo nel prossimo articolo, in primo luogo per i modelli ARMA. Autoregressive (AR) Tutti i modelli di ordine p Il primo modello andavano a prendere in considerazione, che costituisce la base della parte 1, è il modello autoregressivo di ordine p, spesso abbreviato in AR (p). Nel precedente articolo abbiamo considerato il random walk. dove ogni termine, xt dipende esclusivamente sul periodo precedente, x e un termine rumore bianco stocastico, la WT: il modello autoregressivo è semplicemente un'estensione della passeggiata casuale che include termini più indietro nel tempo. La struttura del modello è lineare. che è il modello dipende linearmente alle condizioni precedenti, con coefficienti per ogni termine. Questo è dove il regressiva viene da in autoregressivo. Si tratta essenzialmente di un modello di regressione in cui i termini precedenti sono i predittori. Autoregressive Modello di ordine p Un modello di serie storiche, è un modello autoregressivo di ordine p. AR (p), se: iniziare xt alfa1 x ldots alphap x peso somma p alphai x peso finale dove è rumore bianco e alphai in mathbb, con alphap neq 0 per un processo autoregressivo p-ordine. Se consideriamo l'operatore spostamento all'indietro. (Vedi articolo precedente) allora possiamo riscrivere la sopra in funzione theta di: iniziare thetap () xt (1 - alfa1 - alfa2 2 - ldots - alphap) xt peso terminare Forse la prima cosa da notare sul modello AR (p) è che una passeggiata casuale è semplicemente AR (1) con alfa1 uguale all'unità. Come abbiamo detto in precedenza, il modello autogressive è un'estensione del random walk, quindi questo rende senso è semplice per fare previsioni con il modello AR (p), per qualsiasi tempo t, in quanto una volta che abbiamo i coefficienti alphai determinati, la nostra stima diventa semplicemente: begin cappello t alfa1 x ldots alphap x finisce qui possiamo fare n-passo avanti previsioni producendo cappello t, il cappello, il cappello, ecc fino a cappello. Infatti, una volta si considerano i modelli ARMA nella parte 2, useremo la R funzione per creare le previsioni (insieme con lo standard di confidenza errore bande intervallo) che ci aiuterà a produrre segnali di trading prevedere. Stazionarietà per Autoregressive Processi Uno degli aspetti più importanti del modello AR (p) è che non è sempre stazionaria. Infatti la stazionarietà di un particolare modello dipende dai parametri. Ive ha toccato questo prima in un precedente articolo. Per determinare se un processo AR (p) è stazionario o meno dobbiamo risolvere l'equazione caratteristica. L'equazione caratteristica è semplicemente il modello autoregressivo, scritto in forma di spostamento all'indietro, impostato a zero: Risolviamo questa equazione per. Affinché il particolare processo autoregressivo essere stazionaria abbiamo bisogno tutti i valori assoluti delle radici di questa equazione superare unità. Questa è una proprietà estremamente utile e ci permette di calcolare rapidamente se un processo AR (p) è stazionario o meno. Consente di prendere in considerazione alcuni esempi per rendere questa idea concreta: Random Walk - The AR (1) processo con alfa1 1 ha la caratteristica equazione Theta 1 -. Chiaramente questo ha radice 1 e come tale non è fermo. AR (1) - Se scegliamo alfa1 frac otteniamo xt frac x WT. Questo ci dà una equazione caratteristica di 1 - 0 frac, che ha una radice 4 gt 1 e quindi questo particolare AR (1) processo è stazionario. AR (2) - Se si pone alfa1 alfa2 frac allora otteniamo xt frac x frac x WT. La sua equazione caratteristica diventa - frac () () 0, che dà due radici 1, -2. Dal momento che questo ha una radice unitaria è una serie non stazionaria. Tuttavia, altri AR (2) serie può essere ferma. Secondo Proprietà ordinare la media di un processo AR (p) è pari a zero. Tuttavia, i autocovarianze e autocorrelazioni sono date da funzioni ricorsive, conosciuti come le equazioni di Yule-Walker. Le proprietà completi sono riportati di seguito: begin mux E (xt) 0 fine cominciano gammak somma p alphai gamma, enspace k 0 fine cominciano RHoK somma p alphai rho, enspace k 0 end Si noti che è necessario conoscere i valori dei parametri alphai prima il calcolo delle autocorrelazioni. Ora che weve ha dichiarato la seconda proprietà di ordine possiamo simulare vari ordini di AR (p) e tracciare le correlogrammi corrispondenti. Simulazioni e correlogrammi Iniziamo con un (1) processo di AR. Questo è simile a una passeggiata casuale, salvo che alfa1 non deve uguale all'unità. Il nostro modello sta per avere alfa1 0.6. Il codice R per creare questa simulazione è data come segue: Si noti che il ciclo for è effettuata da 2 a 100, non 1 a 100, come xt-1 quando t0 non è indicizzabile. Analogamente per AR processi di ordine superiore (p), t deve variare da p a 100 in questo ciclo. Siamo in grado di tracciare la realizzazione di questo modello e il suo correlogramma associata utilizzando la funzione di layout: Lascia per ora provare il montaggio di un processo AR (p) per i dati simulati weve appena generato, per vedere se siamo in grado di recuperare i parametri sottostanti. Si può ricordare che abbiamo effettuato una procedura simile in questo articolo su rumore bianco e passeggiate aleatorie. Come si scopre R fornisce un comando utile ar per adattarsi modelli autoregressivi. Possiamo usare questo metodo per dirci in primo luogo il miglior ordine p del modello (come determinato dal AIC sopra) e ci forniscono stime dei parametri per la alphai, che possiamo utilizzare per formare intervalli di confidenza. Per completezza, consente di ricreare la serie X: Ora usiamo il comando ar per adattare un modello autoregressivo al nostro AR simulato (1) processo, utilizzando stima di massima verosimiglianza (MLE) in quanto la procedura di montaggio. Ci sarà in primo luogo estrarre l'ordine migliore ottenuto: Il comando ar ha determinato con successo che il nostro modello di serie storiche di fondo è un (1) processo di AR. Possiamo quindi ottenere il parametro alphai (s) le stime: la procedura MLE ha prodotto una stima, cappello 0.523, che è leggermente inferiore rispetto al vero valore di alfa1 0.6. Infine, possiamo usare l'errore standard (con la varianza asintotica) per la costruzione di intervalli di confidenza 95 attorno al parametro sottostante (s). Per raggiungere questo obiettivo, abbiamo semplicemente creato un vettore c (-1.96, 1.96) e poi moltiplichiamo per l'errore standard: Il vero parametro non rientrano all'interno dell'intervallo di 95 fiducia, come mer aspettarsi dal fatto weve generato la realizzazione dal modello specificamente . Che ne dite se cambiamo la -0.6 alfa1 Come prima di poter montare un AR (p) modello utilizzando ar: Ancora una volta recuperiamo l'ordine corretto del modello, con una stima molto buona cappello -0,597 di alpha1-0.6. Vediamo anche che il vero parametro rientra nell'intervallo di confidenza 95 ancora una volta. Consente di aggiungere un po 'più di complessità per i nostri processi autoregressivi simulando un modello di ordine 2. In particolare, imposteremo alpha10.666, ma anche impostare alfa2 -0,333. Ecco il codice completo per simulare e tracciare la realizzazione, nonché il correlogramma per una tale serie: Come prima possiamo vedere che la correlogramma differisce significativamente da quella di rumore bianco, come sposarsi aspettarsi. Ci sono statisticamente significative a picchi k1, K3 e K4. Ancora una volta, sono state andando a utilizzare il comando ar per adattare un modello AR (p) al nostro AR sottostante (2) realizzazione. La procedura è simile a quella per l'AR (1) in forma: l'ordine corretto è stato recuperato e il parametro di stima cappello 0,696 e cappello -0,395 non sono troppo lontani i valori dei parametri veri di alpha10.666 e alpha2-0.333. Si noti che riceviamo un messaggio di avviso di convergenza. Si noti inoltre che R utilizza in realtà la funzione arima0 per calcolare il modello AR. Come pure imparare in articoli successivi, i modelli (p) AR sono semplicemente ARIMA (p, 0, 0) modelli, e, quindi, un modello AR è un caso speciale di ARIMA con nessun componente media mobile (MA). Bene anche essere utilizzando il comando Arima per creare intervalli di confidenza intorno più parametri, ed è per questo weve trascurato di farlo qui. Ora che weve ha creato alcuni dati simulati è il momento di applicare il modello AR (p) per le serie temporali attività finanziaria. Dati finanziari Amazon Inc. Iniziamo ottenendo il prezzo delle azioni per Amazon (AMZN) utilizzando quantmod come nell'ultimo articolo: Il primo compito è quello di tracciare sempre il prezzo per una breve ispezione visiva. In questo caso ben utilizzando i prezzi di chiusura giornalieri: Avviso Youll che quantmod aggiunge qualche formattazione per noi, vale a dire la data, e un grafico un po 'più bella rispetto alle solite classifiche R: Ora stiamo andando a prendere i rendimenti logaritmici di AMZN e poi la prima order differenza della serie per convertire la serie prezzo originale da una serie non-stazionario (potenzialmente) stazionario. Questo ci permette di confrontare le mele alle mele tra azioni, indici o qualsiasi altro bene, per l'uso in statistica multivariata successivi, come ad esempio quando si calcola una matrice di covarianza. Se si desidera una spiegazione dettagliata del perché i rendimenti di registro sono preferibili, dare un'occhiata a questo articolo sopra a Quantivity. Consente di creare una nuova serie, amznrt. di tenere i nostri rendimenti registro differenziata: Ancora una volta, siamo in grado di tracciare la serie: In questa fase vogliamo tracciare il correlogramma. Sono state cercando di vedere se la serie differenziata si presenta come il rumore bianco. Se non lo fa, allora non vi è correlazione seriale inspiegabile, che potrebbe essere spiegata da un modello autoregressivo. Notiamo un picco significativo a statististically k2. Quindi vi è una ragionevole possibilità di correlazione seriale inspiegabile. Attenzione però, che questo può essere dovuto al campionamento bias. Come tale, si può provare a montare un modello AR (p) per la serie e produrre intervalli di confidenza per i parametri: Montaggio del modello autoregressivo ar al primo ordine differenziata serie di prezzi del registro produce un (2) Modello AR, con il cappello -0,0278 e cappello -0,0687. Ive anche l'uscita della varianza aysmptotic in modo che si possa calcolare errori standard per i parametri e produrre intervalli di confidenza. Vogliamo vedere se zero è parte dell'intervallo di 95 fiducia, come se fosse, riduce la nostra fiducia che abbiamo un vero AR sottostante (2) processo per la serie AMZN. Per calcolare gli intervalli di confidenza al livello del 95 per ogni parametro, usiamo i seguenti comandi. Prendiamo la radice quadrata del primo elemento della matrice di varianza asintotica per produrre un errore standard, quindi creare intervalli di confidenza moltiplicandolo per -1.96 e 1.96 rispettivamente per il livello 95: Si noti che questo diventa più semplice quando si utilizza la funzione arima , ma ben aspettare fino Parte 2 prima di introdurre in modo corretto. Così possiamo vedere che per alfa1 lo zero è contenuta all'interno dell'intervallo di confidenza, mentre per alpha2 zero non è contenuto nel intervallo di confidenza. Quindi dobbiamo stare molto attenti a pensare che abbiamo davvero un AR generativa di fondo (2) modello per AMZN. In particolare si segnala che il modello autoregressivo non tiene conto della volatilità di clustering, che porta al clustering di correlazione seriale serie finanziarie. Se consideriamo i modelli ARCH e GARCH negli articoli successivi, ci conto di questo. Quando arriviamo di utilizzare la funzione completa Arima nel prossimo articolo, faremo predizioni della serie prezzo registro giornaliero al fine di consentire di creare segnali di trading. SampP500 Indice US Equity Insieme con i singoli titoli si può anche prendere in considerazione l'indice azionario degli Stati Uniti, il SampP500. Permette di applicare tutti i comandi precedenti per questa serie e produrre le trame come prima: Possiamo tracciare i prezzi: Come prima, così creare la prima differenza ordine dei prezzi di chiusura di registro: Ancora una volta, siamo in grado di tracciare la serie: E 'chiaro da questo grafico che la volatilità non è stazionario nel tempo. Ciò si riflette anche nella trama del correlogramma. Ci sono molti picchi, tra cui k1 e k2, statisticamente significativa di là di un modello di rumore bianco. Inoltre, vediamo la prova di processi di lunga memoria in quanto vi sono alcuni picchi statisticamente significative a K16, K18 e K21: In definitiva avremo bisogno di un modello più sofisticato di un modello autoregressivo di ordine p. Tuttavia, in questa fase possiamo ancora provare il montaggio di un tale modello. Vediamo cosa otteniamo se non così: Utilizzando ar produce un AR (22) del modello, vale a dire un modello con 22 parametri diversi da zero Cosa ci dice questo E 'indicativo che c'è probabilmente molto di più la complessità nella correlazione seriale di un semplice modello lineare di prezzi passati può davvero spiegare. Tuttavia, lo sapevamo già questo perché possiamo vedere che vi è una significativa correlazione seriale della volatilità. Per esempio, prendere in considerazione il periodo altamente volatile intorno al 2008. Questo motiva la prossima serie di modelli, vale a dire la media mobile MA (q) e la media mobile Autoregressive ARMA (p, q). Bene conoscere entrambi questi nella parte 2 del presente articolo. Come abbiamo più volte ricordiamo, questi saranno in ultima analisi, ci portano alla famiglia ARIMA e GARCH di modelli, entrambi i quali forniranno una misura molto meglio la correlazione complessità di serie del Samp500. Questo ci permetterà di migliorare le nostre previsioni in modo significativo e infine produrre strategie più redditizie. Appena iniziato con modelli quantitativi Trading8.3 autoregressivi In un modello di regressione multipla, si prevede la variabile di interesse utilizzando una combinazione lineare di predittori. In un modello di autoregressione, si prevede la variabile di interesse utilizzando una combinazione lineare di valori passati della variabile. La regressione termine automatica indica che si tratta di una regressione della variabile contro se stessa. Così un modello autoregressivo di ordine p può essere scritta come dove c è una costante ed et è rumore bianco. Questo è come una regressione multipla, ma con valori ritardati di yt come predittori. Ci riferiamo a questo come un modello AR (p). modelli autoregressivi sono notevolmente flessibili nel gestire una vasta gamma di diversi modelli di serie storiche. Le due serie di Figura 8.5 Show Series da un AR (1) modello e un (2) del modello AR. La modifica dei parametri phi1, punti, risultati PHIP in diversi modelli delle serie storiche. La varianza del termine di errore et cambierà solo la scala della serie, non gli schemi. Figura 8.5: Due esempi di dati provenienti da modelli autoregressivi con parametri diversi. A sinistra: AR (1) con YT 18 -0.8y et. A destra: AR (2) con YT 8 1.3y -0.7y et. In entrambi i casi, et distribuzione normale rumore bianco a media nulla e varianza uno. Per un (1) Modello AR: Quando phi10, YT è equivalente al rumore bianco. Quando phi11 e c0, YT è equivalente ad un random walk. Quando phi11 e cne0, YT è equivalente ad un random walk con drift Quando phi1lt0, YT tende ad oscillare tra i valori positivi e negativi. Normalmente limitiamo modelli autoregressivi a dati fissi, e quindi viene richiesto alcuni vincoli sui valori dei parametri. Per un (1) Modello AR: -1 lt phi1 lt 1. Per una (2) Modello AR: -1 lt phi2 lt 1, phi1phi2 lt 1, phi2-phi1 lt 1. Quando PGE3 le restrizioni sono molto più complicate. R si prende cura di queste restrizioni quando si stima un model.2.1 modello a media mobile (modelli MA) modelli di serie tempo noti come modelli ARIMA possono includere termini autoregressivi eo movimento termini medi. In settimana 1, abbiamo imparato un termine autoregressivo in un modello di serie temporale per la variabile x t è un valore ritardato di x t. Per esempio, un ritardo 1 termine autoregressivo è x t-1 (moltiplicato per un coefficiente). Questa lezione definisce lo spostamento termini medi. Un termine media mobile in un modello di serie storica è un errore di passato (moltiplicata per un coefficiente). Sia (wt Overset N (0, sigma2w)), il che significa che la w t sono identicamente, indipendentemente distribuite, ciascuna con una distribuzione normale con media 0 e la stessa varianza. Il modello a media mobile 1 ° ordine, indicato con MA (1) è (xt mu peso theta1w) L'ordine di 2 ° modello a media mobile, indicato con MA (2) è (mu XT peso theta1w theta2w) La q ° ordine modello a media mobile , indicato con MA (q) è (MU XT WT theta1w theta2w punti thetaqw) Nota. Molti libri di testo e programmi software definiscono il modello con segni negativi prima dei termini. Ciò non modificare le proprietà teoriche generali del modello, anche se non capovolgere i segni algebrici di valori dei coefficienti stimati ei termini (unsquared) nelle formule per ACFS e varianze. È necessario controllare il software per verificare se vi siano segni negativi o positivi sono stati utilizzati al fine di scrivere correttamente il modello stimato. R utilizza segnali positivi nel suo modello di base, come facciamo qui. Proprietà teoriche di una serie storica con un MA (1) Modello nota che l'unico valore diverso da zero nella ACF teorico è di lag 1. Tutti gli altri autocorrelazioni sono 0. Quindi un ACF campione con un autocorrelazione significativa solo in ritardo 1 è un indicatore di un possibile MA (1) modello. Per gli studenti interessati, prove di queste proprietà sono in appendice a questo volantino. Esempio 1 Supponiamo che un MA (1) modello è x t 10 w t 0,7 w t-1. dove (WT overset N (0,1)). Così il coefficiente 1 0.7. L'ACF teorica è data da una trama di questa ACF segue. La trama appena mostrato è l'ACF teorico per un MA (1) con 1 0.7. In pratica, un campione abituato di solito forniscono un modello così chiara. Utilizzando R, abbiamo simulato n 100 valori di esempio utilizzando il modello x t 10 w t 0,7 w t-1 dove w t IID N (0,1). Per questa simulazione, un appezzamento serie storica dei dati di esempio segue. Non possiamo dire molto da questa trama. L'ACF campione per i dati simulati segue. Vediamo un picco in ritardo 1 seguito da valori generalmente non significativi per ritardi passato 1. Si noti che il campione ACF non corrisponde al modello teorico della MA sottostante (1), vale a dire che tutte le autocorrelazioni per i ritardi del passato 1 saranno 0 . un campione diverso avrebbe un po 'diverso ACF esempio riportato di seguito, ma probabilmente hanno le stesse caratteristiche generali. Theroretical proprietà di una serie storica con un modello MA (2) Per la (2) il modello MA, proprietà teoriche sono i seguenti: Si noti che gli unici valori diversi da zero nel ACF teorica sono per ritardi 1 e 2. Autocorrelazioni per ritardi superiori sono 0 . Così, un ACF campione con autocorrelazioni significativi a ritardi 1 e 2, ma autocorrelazioni non significative per ritardi più elevato indica una possibile mA (2) modello. iid N (0,1). I coefficienti sono 1 0,5 e 2 0.3. Poiché si tratta di un MA (2), l'ACF teorica avrà valori diversi da zero solo in caso di ritardi 1 e 2. I valori delle due autocorrelazioni diversi da zero sono un grafico della ACF teorica segue. è come quasi sempre accade, i dati di esempio solito si comportano abbastanza così perfettamente come teoria. Abbiamo simulato n 150 valori di esempio per il modello x t 10 w t 0,5 w t-1 .3 w t-2. dove w t iid N (0,1). La trama serie storica dei dati segue. Come con la trama serie per la MA (1) i dati di esempio, non puoi dire molto da esso. L'ACF campione per i dati simulati segue. Il modello è tipico per le situazioni in cui un modello MA (2) può essere utile. Ci sono due picchi statisticamente significative a ritardi 1 e 2 seguiti da valori non significativi per altri ritardi. Si noti che a causa di errore di campionamento, l'ACF campione non corrisponde al modello teorico esattamente. ACF per General MA (q) Models Una proprietà di modelli MA (q), in generale, è che ci sono autocorrelazioni diversi da zero per i primi ritardi Q e autocorrelazioni 0 per tutti i GAL gt q. Non unicità di collegamento tra i valori di 1 e (rho1) in MA (1) Modello. Nella (1) Modello MA, per qualsiasi valore di 1. il reciproco 1 1 dà lo stesso valore per esempio, utilizzare 0,5 per 1. e quindi utilizzare 1 (0,5) 2 per 1. Youll ottenere (rho1) 0,4 in entrambi i casi. Per soddisfare una limitazione teorica chiamato invertibilità. abbiamo limitare MA (1) modelli di avere valori con valore assoluto inferiore 1. Nell'esempio appena dato, 1 0.5 sarà un valore di parametro ammissibile, che non sarà 1 10.5 2. Invertibilità dei modelli MA Un modello MA si dice che sia invertibile se è algebricamente equivalente a un modello AR ordine infinito convergenti. Facendo convergere, si intende che i coefficienti AR diminuiscono a 0 mentre ci muoviamo indietro nel tempo. Invertibilità è una limitazione programmata nel software di serie storiche utilizzate per stimare i coefficienti dei modelli con i termini MA. La sua non è una cosa che controlliamo per l'analisi dei dati. Ulteriori informazioni sul restrizione invertibilit'a per MA (1) modelli è riportato in appendice. Avanzate teoria Note. Per un modello MA (q) con un determinato ACF, vi è un solo modello invertibile. La condizione necessaria per invertibilità è che i coefficienti hanno valori tali che l'equazione 1- 1 y-. - Q q y 0 ha soluzioni per y che non rientrano nel cerchio unitario. R Codice per gli esempi in Esempio 1, abbiamo tracciato l'ACF teorica del modello x t 10 w t. 7W t-1. e poi simulato n 150 valori di questo modello e tracciato le serie temporali del campione e l'ACF campione per i dati simulati. I comandi R utilizzati per tracciare la ACF teoriche sono state: acfma1ARMAacf (Mac (0,7), lag. max10) 10 ritardi di ACF per MA (1) con theta1 0,7 lags0: 10 crea una variabile denominata ritardi che va da 0 a 10. trama (ritardi, acfma1, xlimc (1,10), ylabr, typeh, principale ACF per MA (1) con theta1 0,7) abline (H0) aggiunge un asse orizzontale per la trama il primo comando determina l'ACF e lo memorizza in un oggetto chiamato acfma1 (la nostra scelta del nome). Il comando plot (il 3 ° comando) trame in ritardo rispetto ai valori ACF per ritardi da 1 a 10. Il parametro ylab Contrassegni l'asse Y e il parametro principale mette un titolo sul terreno. Per visualizzare i valori numerici della ACF è sufficiente utilizzare il comando acfma1. La simulazione e le trame sono state fatte con i seguenti comandi. xcarima. sim (N150, elenco (Mac (0,7))) Simula n 150 valori da MA (1) xxc10 aggiunge 10 per rendere medi default 10. simulazione a significare 0. plot (x, TypeB, mainSimulated MA (1) i dati) ACF (x, xlimc (1,10), mainACF per dati campione simulati) nell'Esempio 2, abbiamo tracciato l'ACF teorica del modello xt 10 wt .5 w t-1 .3 w t-2. e poi simulato n 150 valori di questo modello e tracciato le serie temporali del campione e l'ACF campione per i dati simulati. I comandi R utilizzati sono stati acfma2ARMAacf (Mac (0.5,0.3), lag. max10) acfma2 lags0: 10 plot (ritardi, acfma2, xlimc (1,10), ylabr, typeh, principale ACF per MA (2) con theta1 0.5, theta20.3) abline (H0) xcarima. sim (N150, l'elenco (Mac (0,5, 0,3))) xxc10 plot (x, TypeB, principale simulato MA (2) Serie) ACF (x, xlimc (1,10), mainACF per simulato MA (2) dati) Appendice: prova di proprietà di MA (1) per gli studenti interessati, qui ci sono prove per le proprietà teoriche del (1) modello MA. Varianza: (testo (xt) testo (mu peso theta1 w) 0 di testo (in peso) di testo (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Quando h 1, l'espressione precedente 1 w 2. Per ogni h 2, l'espressione precedente 0 . il motivo è che, per definizione di indipendenza della wt. E (w k w j) 0 per ogni k j. Inoltre, perché la w t hanno media 0, E (w j w j) E (w j 2) w 2. Per una serie temporale, applicare questo risultato per ottenere l'ACF cui sopra. Un modello MA invertibile è uno che può essere scritta come modello AR ordine infinito che converge in modo che i coefficienti AR convergono a 0, mentre ci muoviamo infinitamente indietro nel tempo. Bene dimostrare invertibilità per la (1) Modello MA. Abbiamo poi sostituto relazione (2) per w t-1 nell'equazione (1) (3) (ZT WT theta1 (z - theta1w) peso theta1z - theta2w) Al tempo t-2. l'equazione (2) diventa Abbiamo poi rapporto sostituto (4) per w t-2 nell'equazione (3) (ZT peso theta1 z - theta21w WT theta1z - theta21 (z - theta1w) WT theta1z - theta12z theta31w) Se dovessimo continuare a ( infinitamente), otterremmo il modello AR ordine infinito (ZT peso theta1 z - theta21z theta31z - theta41z punti) Nota però, che se 1 1, i coefficienti moltiplicando i ritardi di z aumenterà (infinitamente) in termini di dimensioni, come ci muoviamo nel tempo. Per evitare questo, abbiamo bisogno di 1 LT1. Questa è la condizione per un MA (1) Modello invertibile. Infinite Modello di ordine MA In settimana 3, e vedere che un AR (1) modello può essere convertito in un modello di ordine MA infinite: (xt - mu peso phi1w phi21w punti phik1 w punti riassumono phij1w) Questa somma dei termini di rumore bianco del passato è conosciuto come la rappresentazione causale di un AR (1). In altre parole, x t è un tipo speciale di MA con un numero infinito di termini che vanno indietro nel tempo. Questo è chiamato un ordine infinito MA o MA (). Un ordine MA finito è un AR ordine infinito ed ogni AR ordine finito è un ordine MA infinita. Ricordiamo a settimana 1, abbiamo notato che un requisito per un AR fisso (1) è che 1 LT1. Consente di calcolare il Var (x t) utilizzando la rappresentazione causale. Questo ultimo passo utilizza un fatto di base sulla serie geometrica che richiede (phi1lt1) altrimenti i diverge serie. Navigazione
No comments:
Post a Comment