Modelo autorregresivo de media móbil

En estatística, os modelos autorregresivos de media móbil (AutoRegressive Moving Average models, ARMA en inglés), ás veces chamados modelos Box-Jenkins por George Box e F. M. Jenkins, son tipicamente aplicados a series temporais de datos.

Dada unha serie temporal de datos X_t, entón, o modelo ARMA é unha ferramenta para entender e, ó mellor, predicir futuros valores da serie. O modelo está formado por dúas partes, unha parte autorregresiva (AR) e outra de media móbil (MA). O modelo é normalmente referenciado como un modelo ARMA(p,q), onde p é a orde da parte autoregresiva, e q é a orde da parte de media móbil.

Modelo autorregresivo[editar | editar a fonte]

A notación AR(p) refírese a un modelo autorregresivo de orde p. Un modelo AR(p) pode escribirse como

X_{t}=c+\sum _{i=1}^{p}\phi _{i}X_{t-i}+\epsilon _{t}.\,

onde $\phi _{1},\ldots \phi _{p}$ son os parámetros do modelo, $c$ é unha constante e $\epsilon _{t}$ é un termo de erro. O termo constante é omitido por moitos autores por motivos de simplificación.

Un modelo autorregresivo é esencialmente un filtro IIR (infinite impulse response filter), cunha certa interpretación adicional.

Débese ter en conta que é necesario impor certas restricións aos valores dos parámetros deste modelo para que funcione correctamente estacionario. Por exemplo, nun modelo AR(1), se |φ₁| > 1 o modelo non terá un bo comportamento.

Exemplo: Un proceso AR(1)[editar | editar a fonte]

An AR(1)-Process is given by

X_{t}=c+\phi X_{t-1}+\epsilon _{t},\,

onde $\epsilon _{t}$ é un proceso de ruído branco con media cero e varianza $\sigma ^{2}$ . (Nota: O subíndice en $\phi _{1}$ foi omitido.) O proceso é de covariaza estacionaria se $|\phi |<1$ . Se $\phi =1$ entón $X_{t}$ ten unha raíz unitaria. O cálculo da esperanza de $X_{t}$ é directo. Asumindo a covarianza estacionaria temos

{\mbox{E}}(X_{t})={\mbox{E}}(c)+\phi {\mbox{E}}(X_{t-1})+{\mbox{E}}(\epsilon _{t})\Rightarrow \mu =c+\phi \mu +0

.

entón:

\mu ={\frac {c}{1-\phi }},

onde $\mu$ é a media. A varianza é:

{\textrm {var}}(X_{t})=E(X_{t}^{2})-\mu ^{2}={\frac {\sigma ^{2}}{1-\phi ^{2}}}

A función de autocorrelación vén dada por:

B_{n}=E(X_{t+n}X_{t})-\mu ^{2}={\frac {\sigma ^{2}}{1-\phi ^{2}}}\,\,\phi ^{|n|}

Pódese ver que a función de autocorrelación decrece cun intervalo de decrecemento de $\tau =-1/\ln(\phi )$ . A función de densidade espectral é a transformada de Fourier da función de autocorrelación. En termos discretos esta sería a transformada de Fourier de tempo discreto:

\Phi (\omega )={\frac {1}{\sqrt {2\pi }}}\,\sum _{n=-\infty }^{\infty }B_{n}e^{-i\omega n}={\frac {1}{\sqrt {2\pi }}}\,\left({\frac {\sigma ^{2}}{1+\phi ^{2}-2\phi \cos(\omega )}}\right)

Esta expresión contén aliasing debido á natureza discreta de $X_{j}$ . Se asumimos que o intervalo de mostraxe é moito menor que o intervalo de decrecemento ( $\tau \ll 1$ ), entón podemos utilizar unha aproximación continua a $B_{n}$ :

B(t)\approx {\frac {\sigma ^{2}}{1-\phi ^{2}}}\,\,\phi ^{|t|}

que dá un perfil Lorentzian para a densidade espectral:

\Phi (\omega )=={\frac {1}{\sqrt {2\pi }}}\,{\frac {\sigma ^{2}}{1-\phi ^{2}}}\,{\frac {\gamma }{\pi (\gamma ^{2}+\omega ^{2})}}

onde $\gamma =1/\tau$ é a frecuencia angular asociada co intervalo de decrecemento $\tau$ .

Unha expresión alternativa para $X_{t}$ pódese obter substituíndo primeiro $c+\phi X_{t-2}+\epsilon _{t-1}$ por $X_{t-1}$ na ecuación de definición. Continuando este proceso N veces obtemos:

X_{t}=c\sum _{k=0}^{N-1}\phi ^{k}+\phi ^{N}X_{t-N}+\sum _{k=0}^{N-1}\phi ^{k}\epsilon _{t-k}

Cando N tende a infinito, $\phi ^{N}$ tende a cero e:

X_{t}={\frac {c}{1-\phi }}+\sum _{k=0}^{\infty }\phi ^{k}\epsilon _{t-k}

Vese que $X_{t}$ é ruído branco convolucionado con $\phi ^{k}$ máis a constante da media. Polo teorema do límite central, $X_{t}$ será distribuído normalmente como calquera mostra de $X_{t}$ que é máis grande que o intervalo de decrecemento da función de autocorrelación.

Modelo de medias móbiles[editar | editar a fonte]

A notación MA(q) refírese a un modelo de media móbil de orde q.

X_{t}=\varepsilon _{t}+\sum _{i=1}^{q}\theta _{i}\varepsilon _{t-i}\,

onde θ₁, ..., θ_q son os parámetros do modelo e ε_t, ε_t-1,... son, de novo, os termos de erro. Un modelo de medias móbiles é esencialmente un filtro FIR (finite impulse response filter), con certa interpretación adicional.

Modelo autorregresivo de media móbil[editar | editar a fonte]

A notación ARMA(p, q) refírese a un modelo con p termos autorregresivos e q termos de media móbil. Este modelo combina os modelos AR e MA,

X_{t}=\varepsilon _{t}+\sum _{i=1}^{p}\phi _{i}X_{t-i}+\sum _{i=1}^{q}\theta _{i}\varepsilon _{t-i}.\,

Nota sobre os termos de erro[editar | editar a fonte]

Os termos de erro ε_t asúmese normalmente que son variables iid (variables aleatorias independentes identicamente-distribuídas) mostreadas dunha distribución normal con media cero: ε_t ~ N(0,σ²) onde σ² é a varianza. Estas suposicións poden ser fráxiles e se non se cumpren poden cambiar as propiedades do modelo. De feito, un cambio na suposición da independencia e distribución idéntica podería dar lugar a unha substancial diferenza.

Especificación en termos do operador retardo (lag operator)[editar | editar a fonte]

Nalgúns textos os modelos son especificados en termos do operador retardo L. Nestes termos, o modelo AR(p) vén dado por

\varepsilon _{t}=\left(1-\sum _{i=1}^{p}\phi _{i}L^{i}\right)X_{t}=\phi X_{t}\,

onde φ representa o polinomio

\phi =1-\sum _{i=1}^{p}\phi _{i}L^{i}.\,

Un modelo MA(q) vén dado por

X_{t}=\left(1+\sum _{i=1}^{q}\theta _{i}L^{i}\right)\varepsilon _{t}=\theta \varepsilon _{t}\,

onde θ representa o polinomio

\theta =1+\sum _{i=1}^{q}\theta _{i}L^{i}.\,

Por último, o modelo combinatorio ARMA vén dado por

\left(1-\sum _{i=1}^{p}\phi _{i}L^{i}\right)X_{t}=\left(1+\sum _{i=1}^{q}\theta _{i}L^{i}\right)\varepsilon _{t}\,

ou de xeito máis conciso,

\phi X_{t}=\theta \varepsilon _{t}.\,

Modelos de axuste (Fitting models)[editar | editar a fonte]

Os modelos ARMA en xeral poden, tras escoller p e q, ser axustados mediante regresión de mínimos cadrados parar encontrar os valores dos parámetros que minimizan o termo de erro. Considérase xeralmente unha boa práctica encontrar os valores menores de p e q que proporcionan un ajuste aceptable aos datos. Para un modelo puro AR débense utilizar as ecuacións Yule-Walker para proporcionar un axuste.

Xeneralizacións[editar | editar a fonte]

A dependencia de X_t en valores pasados e nos termos de erro ε_t asúmese que é lineal salvo que se especifique o contrario. Se a dependencia non é lineal, o modelo é especificamente chamado modelo de media móbil non lineal (NMA), autorregresivo non lineal (NAR), ou autorregresivo de media móbil non lineal (NARMA).

Os modelos autorregresivos de media móbil poden xeneralizarse doutros xeitos. Véxase tamén os modelos ARCH (modelos de heterocedasticidade condicional autorregresivos) e os modelos ARIMA (modelos autorregresivos integrados de medias móbiles). Se temos que axustar múltiples series temporais, entón pódese axustar un modelo vectorial ARIMA (VARIMA). Se as series temporais en cuestión mostran unha longa memoria, entón é apropiado un modelo ARIMA fraccional (FARIMA, ou ás veces chamado ARFIMA). De pensar que os datos teñen certa estacionalidade, entón débese usar un modelo SARIMA.

Notas[editar | editar a fonte]

George E.P. Box e F.M. Jenkins. Time Series Analysis: Forecasting and Control, second edition. Oakland, CA: Holden-Day, 1976.