Distribución lognormal

Na Galipedia, a Wikipedia en galego.
Log-normal
Función de densidade
Gráfico da Lognormal PDF
μ=0
Función de distribución
Grafico da Lognormal CDF
μ=0
Parámetros s \ge 0
-\infty \le \mu \le \infty
Soporte x \in [0; +\infty)\!
pdf \frac{e^{-[\frac{\ln(x)-\mu}{\sigma}]^2/2]}}{x\sigma \sqrt{2\pi}}
cdf \frac{1}{2}+\frac{1}{2} \mathrm{Erf}\left[\frac{\ln(x)-\mu}{\sigma\sqrt{2}}\right]
Media e^{\mu+\sigma^2/2}
Mediana e^{\mu}
Moda e^{\mu-\sigma^2}
Varianza (e^{\sigma^2}\!\!-1) e^{2\mu+\sigma^2}
Asimetría e^{-\mu-\sigma^2/2}(e^{\sigma^2}\!\!+2)\sqrt{e^{\sigma^2}\!\!-1}
Curtose e^{4\sigma^2}\!\!+2e^{3\sigma^2}\!\!+3e^{2\sigma^2}\!\!-6
Entropía \frac{1}{2}+\frac{1}{2}\ln(2\pi\sigma^2)
mgf (ver no texto os momentos)
Func. caract.

En probabilidade e estatísticas, a distribución log-normal é a distribución de probabilidade de calquera variable aleatoria con seu logaritmo normalmente distribuído (a base da función logarítmica non é importante xa que se loga X está distribuída normalmente si e solo si logb X está distribuída normalmente). Se X é unha variable aleatoria cunha distribución normal, entón exp(X) ten unha distribución log-normal.

"Log-normal" tamén se escribe "log normal" ou "lognormal".

Unha variable pode ser modelada como log-normal se pode ser considerada como o produto multiplicativo de moitos pequenos factores independentes. Un exemplo típico é o retorno a longo prazo de unha inversión nunha acción: pódese considerar como o produto dos retornos diarios.

A distribución log-normal ten a función densidade de probabilidade

f(x;\mu,\sigma) = \frac{1}{x \sigma \sqrt{2 \pi}} e^{-(\ln x - \mu)^2/2\sigma^2}

para x>0, onde \mu e \sigma son a media e o desvío estándar do logaritmo da variable. O valor esperado é

\mathrm{E}(X) = e^{\mu + \sigma^2/2}

e a varianza é

\mathrm{var}(X) = (e^{\sigma^2} - 1) e^{2\mu + \sigma^2}.

Relación coa media e o desvío estándar xeométrico[editar | editar a fonte]

A distribución log-normal, a media xeométrica, e o desvío estándar xeométrico están relacionadas. Neste caso, a media xeométrica é igual a \exp(\mu) e o desvío estándar xeométrico é igual a\exp(\sigma).

Se unha mostra de datos determínase que proven dunha poboación distribuída seguindo unha log-normal, a media xeométrica e o desvío estándar xeométrico pódense utilizar para estimar os intervalos de confianza tal como a media aritmética e o desvío estándar se usan para estimar os intervalos de confianza para un dato distribuído normalmente.

Límite do intervalo de confianza espazo log xeométrica
3σ límite inferior \mu - 3\sigma \mu_\mathrm{geo} / \sigma_\mathrm{geo}^3
2σ límite inferior \mu - 2\sigma \mu_\mathrm{geo} / \sigma_\mathrm{geo}^2
1σ límite inferior \mu - \sigma \mu_\mathrm{geo} / \sigma_\mathrm{geo}
1σ límite superior \mu + \sigma \mu_\mathrm{geo} \sigma_\mathrm{geo}
2σ límite superior \mu + 2\sigma \mu_\mathrm{geo} \sigma_\mathrm{geo}^2
3σ límite superior \mu + 3\sigma \mu_\mathrm{geo} \sigma_\mathrm{geo}^3

Onde a media xeométrica \mu_\mathrm{geo} = \exp(\mu) e o desvío estándar xeométrico \sigma_\mathrm{geo} = \exp(\sigma)

Momentos[editar | editar a fonte]

Os primeiros momentos son:

\mu_1=e^{\mu+\sigma^2/2}
\mu_2=e^{2\mu+4\sigma^2/2}
\mu_3=e^{3\mu+9\sigma^2/2}
\mu_4=e^{4\mu+16\sigma^2/2}

ou de forma xeral:

\mu_k=e^{k\mu+k^2\sigma^2/2}.

Estimación de parámetros Maximum likelihood[editar | editar a fonte]

Para determina-los estimadores que máis aproximan os parámetros μ e σ da distribución log-normal, podemos utilizar o mesmo procedemento que para a distribución normal. Para non repetilo, obsérvese que

f_L (x;\mu, \sigma) = \frac 1 x \, f_N (\ln x; \mu, \sigma)

onde por f_L (\cdot) denotamos a función de densidade de probabilidade da distribución log-normal, e por f_N (\cdot)— a da distribución normal. Polo tanto, utilizando os memos índices para denotar as distribucións, podemos escribir que

\begin{matrix}
  \ell_L (x_1, x_2, ..., x_n; \mu, \sigma)
  & = & - \sum _k \ln x_k + \ell_N (\ln x_1, \ln x_2, ..., \ln x_n; \mu, \sigma) = \\
\ & = & \operatorname {const} (\mu, \sigma) + \ell_N (\ln x_1, \ln x_2, ..., \ln x_n; \mu, \sigma).
\end{matrix}

Xa que o primeiro termo é constante respecto a μ e σ, ambas funcións logarítmicas, \ell_L e \ell_N, obteñen o seu máximo co mesmo μ e σ. Por tanto, utilizando as fórmulas para os estimadores dos parámetros da distribución normal, e a inigualdade de arriba, deducimos que para a distribución log-normal cúmplese

\widehat \mu = \frac {\sum_k \ln x_k} n, \ 
        \widehat \sigma^2 = \frac {\sum_k {\left( \ln x_k - \widehat \mu \right)^2}} n.

Distribución relacionadas[editar | editar a fonte]

  • Y \sim N(\mu, \sigma^2) é unha distribución normal se Y = \ln(X) e X \sim \operatorname{Log-N}(\mu, \sigma^2).
  • Se X_m \sim \operatorname {Log-N} (\mu, \sigma_m^2), \ m = \overline {1 ... N} son variables independentes log-normalmente distribuidas co mesmo parámetro μ e permitindo que varie σ, e Y = \prod_{m=1}^N X_m, entón Y é unha variable distribuida log-normalmente como: Y \sim \operatorname {Log-N} \left( \mu, \sum _m \sigma_m^2 \right).

Véxase tamén[editar | editar a fonte]