Variable aleatoria

Na Galipedia, a Wikipedia en galego.

Unha variable aleatoria pode verse como un resultado numérico de operar un mecanismo non-determinista ou realizar un experimento non determinista para xerar un resultado aleatorio. Por exemplo, unha variable aleatoria pode ser usada para describir o proceso de lanzamento dun dato cos seus posibles resultados { 1, 2, 3, 4, 5, 6 }. Outra variable aleatoria pode describir os resultados de coller unha persoa aleatoriamente e medir o seu peso.

A diferenza da práctica común con outras variables matemáticas, unha variable aleatoria non pode ser asignada a un valor; unha variable aleatoria non describe o resultado actual dun experimento particular, senón que describe os posibles, así como indeterminados resultados en termos de números reais.

Os exemplos sinxelos de lanzamento dun dato ou a medida do peso permiten unha visualización do uso práctico das variables aleatorias, a súa construción matemática permite ós matemáticos traballar con moita teoría da probabilidade e teoría da medida no dominio máis familiar das funcións de números reais. Do mesmo xeito, o concepto tamén sitúa experimentos que involucran resultados con números reais dentro do campo de traballo da teoría da medida.

Definicións[editar | editar a fonte]

Variables aleatorias[editar | editar a fonte]

Hai quen considera a expresión "variable aleatoria" un nome erróneo: unha variable aleatoria é unha función que mapea eventos con números. Sexa A unha σ-álxebra e Ω o espazo de eventos relevante para o experimento a realizar. No exemplo do lanzamento do dado, o espazo de eventos son os posibles resultados da tirada, p.e. Ω = { 1, 2, 3, 4, 5, 6 }, e A sería o conxunto de pares de Ω. Neste caso, unha variable aleatoria aproximada podería ser X(ω) = ω, tal que se o resultado é '1', a variable aleatoria e tamén igual a 1. Un exemplo menos trivial pero igualmente sinxelo é o do lanzamento dunha moeda: un espazo de eventos posible axeitado sería Ω = { C, S } (para caras e selos), e A sería de novo o conxunto de pares de Ω. Unha das moitas posibles variables aleatorias definidas neste espazo é

X(\omega) = \begin{cases}0,& \omega = \texttt{C},\\1,& \omega = \texttt{S}.\end{cases}

Matematicamente, unha variable aleatoria é definida como unha función medible dende un espazo de probabilidade cara a un espazo medible. Este espazo medible é o espazo de posibles valores da variable, e acostuma tomarse como os números reais coa σ-álxebra Borel. Isto é asumido no seguinte, excepto onde se especifique o contrario.

Sexa (Ω, A, P) o espazo de probabilidade. Formalmente, unha función X: Ω → R é unha variable aleatoria real se para todo subconxunto Ar = { ω : X(ω) ≤ r } onde rR, temos tamén ArA.

A importancia desta definición técnica é que nos permite construír a función de distribución dunha variable aleatoria.

Funcións de distribución[editar | editar a fonte]

Dada unha variable aleatoria X: \Omega \to \mathbb{R} definida no espazo de probabilidade (\Omega , P), podemos responder a cuestións como "Que probabilidade hai de que o valor de X sexa maior que 2?". Isto é o mesmo que a probabilidade do evento\{ s \in\Omega : X(s) > 2 \} que se escribe moitas veces como P(X > 2) para abreviar.

Gardando todas estas probabilidades de rangos de saída da variable aleatoria real X obtemos a distribución de probabilidade de X. A distribución de probabilidade "esquécese" do espazo de probabilidade particular usado para definir X e só recorda as probabilidades dos valores de X. Unha distribución de probabilidade así pode ser sempre obtida mediante a súa función de distribución de probabilidade

F_X(x) = \operatorname{P}(X \le x)

e ás veces tamén usando a función de densidade de probabilidade. En termos da teoría da medida, usamos a variable aleatoria X para sacar a medida P de Ω para unha medida dF en R. O espazo de probabilidade subxacente Ω é un mecanismo técnico usado para garanti-la existencia de variables aleatorias, e ás veces para construílas. Na práctica, a miúdo non se dispón do espazo Ω é simplemente ponse a medida en R que asigna medida 1 para toda a liña real, p.e., trabállase coas distribucións de probabilidade en vez de coas variables aleatorias.

Funcións de variables aleatorias[editar | editar a fonte]

Se temos unha variable aleatoria X en Ω e unha función medible f: RR, entón Y = f(X) tamén será unha variable aleatoria en Ω, xa que a composición de funcións medibles tamén é medible. O mesmo procedemento que permite ir dun espazo de probabilidade (Ω, P) a (R, dFX) pode ser usado para obter a distribución de Y. A función de distribución acumulativa de Y é

F_Y(y) = \operatorname{P}(f(X) \le y).

Exemplo[editar | editar a fonte]

Sexa X unha variable aleatoria continua real, e sexa Y = X2. Entón,

F_Y(y) = \operatorname{P}(X^2 \le y).

Se y < 0, entón P(X2y) = 0, e entón

F_Y(y) = 0\qquad\hbox{if}\quad y < 0.

Se y ≥ 0, entón

\operatorname{P}(X^2 \le y) = \operatorname{P}(|X| \le \sqrt{y})
 = \operatorname{P}(-\sqrt{y} \le  X \le \sqrt{y}),

por tanto

F_Y(y) = F_X(\sqrt{y}) - F_X(-\sqrt{y})\qquad\hbox{if}\quad y \ge 0.

Momentos[editar | editar a fonte]

A distribución de probabilidade dunha variable aleatoria caracterízase a miúdo cun número pequeno de parámetros, os cales teñen unha interpretación práctica. Por exemplo, a miúdo é suficiente con coñecer o "valor medio". Isto está integrado no concepto matemático de valor esperado dunha variable aleatoria, descrito como E[X]. Nótese que en xeral, E[f(X)] non é o mesmo que f(E[X]). Unha vez coñecido o "valor medio", podémonos preguntar canto lonxe normalmente están do valor medio os valores de X , esta cuestíon respóndese coa varianza e a desviación estándar da variable aleatoria.

Matematicamente, isto é coñecido como o problema de momentos (xeralizado): para unha clase dada de variables aleatorias X, atopar a colección {fi} de funcións tal que os valores esperados E[fi(X)] caractericen completamente a distribución da variable aleatoria X.

Equivalencia de variables aleatorias[editar | editar a fonte]

Hai varias sensos diferentes nos que se pode considerar que as variables aleatorias son equivalentes. Dúas variables aleatorias poden ser iguales, case iguales, iguales en media, ou iguales en distribución.

En orde incremental, a definición de estas definicións de equivalencia móstranse a continuación

Igualdade en distribución[editar | editar a fonte]

Dúas variables aleatorias X e Y son iguales en distribución se

\operatorname{P}(X \le x) = \operatorname{P}(Y \le x)\quad\hbox{para todo}\quad x.

Para ser iguales en distribución, as variables aleatorias teñen que ser definidas no mesmo espazo de probabilidade, pero sen perda de xeralidade, poden definirse en variables aleatorias independentes no mesmo espazo de probabilidade. A definición de equivalencia en distribución pode asociarse coa seguinte definición de distancia entre distribucións de probabilidade,

d(X,Y)=\sup_x|\operatorname{P}(X \le x) - \operatorname{P}(Y \le x)|,

que é a base do Test Kolmogorov-Smirnov.

Igualdade en media[editar | editar a fonte]

Dúas variables aleatorias X e Y son iguales en media p-ésima se o momento pésimode |XY| é cero, isto é,

\operatorname{E}(|X-Y|^p) = 0.

Igualdade na media pésima implica igualdade na media qésima para todo q<p. Ó igual que no caso anterior, hai unha distancia relacionada coas variables aleatorias

d_p(X, Y) = \operatorname{E}(|X-Y|^p).

Case igualdade[editar | editar a fonte]

Dúas variables aleatorias X e Y son iguales absolutamente se, e só se, a probabilidade de que sexan diferentes é cero:

\operatorname{P}(X \neq Y) = 0.

Para tódolos propósitos prácticos da teoría da probabilidade, esta noción de equivalencia é tan forte como a igualdade. Está asociada á seguinte distancia:

d_\infty(X,Y)=\sup_\omega|X(\omega)-Y(\omega)|,

onde 'sup' neste caso representa o supremo esencial no senso da teoría da medida.

Igualdade[editar | editar a fonte]

Finalmente, dúas variables aleatorias X e Y son iguales se son iguales como funcións do seu espazo de probabilidade, isto é,

X(\omega)=Y(\omega)\qquad\hbox{for all}\quad\omega

Converxencia[editar | editar a fonte]

Moitas das estatísticas matemáticas consisten en proba-la converxencia dos resultadas para certas secuencias de variables aleatorias, véxase por exemplo a lei dos grandes números e o teorema do límite central.

Hai varios xeitos en que unha secuencia (Xn) de variables aleatorias pode converxer a unha variable aleatoria X. Véxase converxencia de variables aleatorias.

Véxase tamén[editar | editar a fonte]