Modelos autorregresivos integrados de medias móbiles

Na Galipedia, a Wikipedia en galego.

En estatística, un modelo autorrregresivo integrado de medias móbiles (ARIMA) é unha xeralización dun modelo autorregresivo de media móbil (ARMA). Estes modelos axústanse a datos de series temporales para entender mellor os datos ou para predicir puntos futuros da serie. O modelo sóese describir como un modelo ARIMA(p,d,q) onde p, d e q son enteiros iguales ou maiores que cero e fan referencia ó orde das partes autorregresiva, integrada e de medias móbiles do modelo, respectivamente.

Dada unha serie temporal de datos Xt (onde t é un valor enteiro e Xt son números reales) entón o modelo ARMA(p,q) ven dado por

\left(1 - \sum_{i=1}^p \phi_i L^i\right) X_t = \left(1 + \sum_{i=1}^q \theta_i L^i\right) \varepsilon_t\,

onde L é o operador retardo, os φi son os parámetros da parte autorregresiva do modelo, os θi son os parámetros da parte de medias móbiles e os εt son termos de error. Os termos de error εt asúmese que son xeralmente variables iid mostreadas dunha distribución normal con media cero: εt ~ N(0,σ2) onde σ2 é a varianza.

O modelo ARMA xeralízase engadindo un parámetro d para crear o modelo ARIMA (p, d, q)

\left(1 - \sum_{i=1}^p \phi_i L^i\right) (1-L)^d X_t = \left(1 + \sum_{i=1}^q \theta_i L^i\right) \varepsilon_t\,

onde d é un enteiro positivo (se d é cero entón o modelo é equivalente a un modelo ARMA). Debe terse en conta que non tóloas combinacións de parámetros producen modelos con comportamento correcto. En particular, se o modelo quérese que sexa estacionario os parámetros deberán cumprir certas condicións.

Algúns casos especiales do modelo dedúcense de xeito natural. Por exemplo, un modelo ARIMA(0,1,0) ven dado por:

X_t = X_{t-1} + \varepsilon

o cal é un simple camiño aleatorio.

Úsanse moitas variacións do modelo ARIMA. Por exemplo, se se usan varias series temporales, Xt pódense considerar como vectores, e entón un modelo VARIMA pode ser máis apropiado. Outro exemplo, supoñamos o volume de tráfico dunha estrada. Os fins de semá teñen un comportamento claramente diferenciado dos días de semana. Neste caso considérase que é mellor utilizar un modelo SARIMA (ARIMA estacional) que incrementar o orde das partes AR e MA do modelo. Se se sospeita que a serie temporal conten dependencia ó longo do tempo, entón o parámetro d debe substituírse por valores non enteiros num modelo fraccional ARIMA (FARIMA, ou tamén chamado ARFIMA).