Modelo autorregresivo de media móbil

Na Galipedia, a Wikipedia en galego.

En estatística, os modelos autorregresivos de media móbil (AutoRegressive Moving Average models, ARMA en inglés), as veces chamados modelos Box-Jenkins por George Box e F. M. Jenkins, son tipicamente aplicados a series temporais de datos.

Dada unha serie temporal de datos Xt, entón, o modelo ARMA é unha ferramenta para entender e, ó mellor, predicir futuros valores da serie. O modelo está formado por dúas partes, unha parte autorregresiva (AR) e outra de media móbil (MA). O modelo é normalmente referenciado como un modelo ARMA(p,q), onde p é a orde da parte autoregresiva, e q é a orde da parte de media móbil.

Modelo autorregresivo[editar | editar a fonte]

A notación AR(p) refírese a un modelo autorregresivo de orde p. Un modelo AR(p) pode escribirse como

 X_t = c + \sum_{i=1}^p \phi_i X_{t-i}+ \epsilon_t .\,

onde \phi_1, \ldots \phi_p son os parámetros do modelo, c é unha constante e \epsilon_t é un termo de erro. O termo constante é omitido por moitos autores por motivos de simplificación.

Un modelo autorregresivo é esencialmente un filtro IIR (infinite impulse response filter), cunha certa interpretación adicional.

Débese ter en conta que é necesario impor certas restricións aos valores dos parámetros deste modelo para que funcione correctamente estacionario. Por exemplo, nun modelo AR(1), se |φ1| > 1 o modelo non terá un bo comportamento.

Exemplo: Un proceso AR(1)[editar | editar a fonte]

An AR(1)-Process is given by

X_t = c + \phi X_{t-1}+\epsilon_t,\,

onde \epsilon_t é un proceso de ruído branco con media cero e varianza \sigma^2. (Nota: O subíndice en \phi_1 foi omitido.) O proceso é de covariaza estacionaria se |\phi|<1. Se \phi=1 entón X_t ten unha raíz unitaria. O cálculo da esperanza de X_t é directo. Asumindo a covarianza estacionaria temos

\mbox{E}(X_t)=\mbox{E}(c)+\phi\mbox{E}(X_{t-1})+\mbox{E}(\epsilon_t)\Rightarrow \mu=c+\phi\mu+0.

entón:

\mu=\frac{c}{1-\phi},

onde \mu é a media. A varianza é:

\textrm{var}(X_t)=E(X_t^2)-\mu^2=\frac{\sigma^2}{1-\phi^2}

A función de autocorrelación ven dada por:

B_n=E(X_{t+n}X_t)-\mu^2=\frac{\sigma^2}{1-\phi^2}\,\,\phi^{|n|}

Pódese ver que a función de autocorrelación decrece cun intervalo de decrecemento de \tau=-1/\ln(\phi). A función de densidade espectral é a transformada de Fourier da función de autocorrelación. En termos discretos esta sería a transformada de Fourier de tempo discreto:

\Phi(\omega)=
\frac{1}{\sqrt{2\pi}}\,\sum_{n=-\infty}^\infty B_n e^{-i\omega n}
=\frac{1}{\sqrt{2\pi}}\,\left(\frac{\sigma^2}{1+\phi^2-2\phi\cos(\omega)}\right)

Esta expresión contén aliasing debido á natureza discreta de X_j. Se asumimos que o intervalo de mostraxe é moito menor que o intervalo de decrecemento (\tau\ll 1), entón podemos utilizar unha aproximación continua a B_n:

B(t)\approx \frac{\sigma^2}{1-\phi^2}\,\,\phi^{|t|}

que dá un perfil Lorentzian para a densidade espectral:

\Phi(\omega)=
=\frac{1}{\sqrt{2\pi}}\,\frac{\sigma^2}{1-\phi^2}\,\frac{\gamma}{\pi(\gamma^2+\omega^2)}

onde \gamma=1/\tau é a frecuencia angular asociada co intervalo de decrecemento \tau.

Unha expresión alternativa para X_t pódese obter substituíndo primeiro c+\phi X_{t-2}+\epsilon_{t-1} por X_{t-1} na ecuación de definición. Continuando este proceso N veces obtemos:

X_t=c\sum_{k=0}^{N-1}\phi^k+\phi^NX_{t-N}+\sum_{k=0}^{N-1}\phi^k\epsilon_{t-k}

Cando N tende a infinito, \phi^N tende a cero e:

X_t=\frac{c}{1-\phi}+\sum_{k=0}^\infty\phi^k\epsilon_{t-k}

Vese que X_t é ruído branco convolucionado con \phi^k máis a constante da media. Polo teorema do límite central, X_t será distribuido normalmente como calquera mostra de X_t que é máis grande que o intervalo de decrecemento da función de autocorrelación.

Modelo de medias móbiles[editar | editar a fonte]

A notación MA(q) refírese a un modelo de media móbil de orde q.

 X_t = \varepsilon_t + \sum_{i=1}^q \theta_i \varepsilon_{t-i}\,

onde θ1, ..., θq son os parámetros do modelo e εt, εt-1,... son, de novo, os termos de erro. Un modelo de medias móbiles é esencialmente un filtro FIR (finite impulse response filter), con certa interpretación adicional.

Modelo autorregresivo de media móbil[editar | editar a fonte]

A notación ARMA(p, q) refírese a un modelo con p termos autorregresivos e q termos de media móbil. Este modelo combina os modelos AR e MA,

 X_t = \varepsilon_t +  \sum_{i=1}^p \phi_i X_{t-i} + \sum_{i=1}^q \theta_i \varepsilon_{t-i}.\,

Nota sobre os termos de erro[editar | editar a fonte]

Os termos de erro εt asúmese normalmente que son variables iid (variables aleatorias independentes identicamente-distribuídas) mostreadas dunha distribución normal con media cero: εt ~ N(0,σ2) onde σ2 é a varianza. Estas suposicións poden ser fráxiles e se non se cumpren poden cambiar as propiedades do modelo. De feito, un cambio na suposición da independencia e distribución idéntica podería dar lugar a unha substancial diferencia.

Especificación en termos do operador retardo (lag operator)[editar | editar a fonte]

Nalgúns textos os modelos son especificados en termos do operador retardo L. Nestes termos, o modelo AR(p) ven dado por

 \varepsilon_t = \left(1 - \sum_{i=1}^p \phi_i L^i\right) X_t =  \phi X_t\,

onde φ representa o polinomio

 \phi = 1 - \sum_{i=1}^p \phi_i L^i.\,

Un modelo MA(q) ven dado por

 X_t = \left(1 + \sum_{i=1}^q \theta_i L^i\right) \varepsilon_t = \theta \varepsilon_t\,

onde θ representa o polinomio

 \theta= 1 + \sum_{i=1}^q \theta_i L^i.\,

Por último, o modelo combinatorio ARMA ven dado por

 \left(1 - \sum_{i=1}^p \phi_i L^i\right) X_t = \left(1 + \sum_{i=1}^q \theta_i L^i\right) \varepsilon_t\,

ou de xeito máis conciso,

 \phi X_t = \theta \varepsilon_t.\,

Modelos de axuste (Fitting models)[editar | editar a fonte]

Os modelos ARMA en xeral poden, tras escoller p e q, ser axustados mediante regresión de mínimos cadrados parar encontrar os valores dos parámetros que minimizan o termo de erro. Considérase xeralmente unha boa práctica encontrar os valores menores de p e q que proporcionan un ajuste aceptable aos datos. Para un modelo puro AR débense utilizar as ecuacións Yule-Walker para proporcionar un axuste.

Xeneralizacións[editar | editar a fonte]

A dependencia de Xt en valores pasados e nos termos de erro εt asúmese que é lineal salvo que se especifique o contrario. Se a dependencia non é lineal, o modelo é especificamente chamado modelo de media móbil non lineal (NMA), autorregresivo non lineal (NAR), ou autorregresivo de media móbil non lineal (NARMA).

Os modelos autorregresivos de media móbil poden xeneralizarse doutros xeitos. Véxase tamén os modelos ARCH (modelos de heterocedasticidade condicional autorregresivos) e os modelos ARIMA (modelos autorregresivos integrados de medias móbiles). Se temos que axustar múltiples series temporais, entón pódese axustar un modelo vectorial ARIMA (VARIMA). Se as series temporais en cuestión mostran unha longa memoria, entón é apropiado un modelo ARIMA fraccional (FARIMA, ou ás veces chamado ARFIMA). De pensar que os datos teñen certa estacionalidade, entón débese usar un modelo SARIMA.

Notas[editar | editar a fonte]

  • George E.P. Box and F.M. Jenkins. Time Series Analysis: Forecasting and Control, second edition. Oakland, CA: Holden-Day, 1976.