Distribución normal

Para outras páxinas con títulos homónimos véxase: Distribución.

**Normal**
Función de densidade As catro distribucións do gráfico son normais, con distintos valores da media e a desviación típica. A verde é a "normal reducida", de media cero e desviación típica un
Función de distribución As cores son as mesmas das funcións de probabilidade de arriba
Parámetros	$\mu$ localización (real) $\sigma ^{2}>0$ cadrado escala (real)
Soporte	$x\in (-\infty ;+\infty )\!$
Función de densidade	${\frac {1}{\sigma {\sqrt {2\pi }}}}\;\exp \left(-{\frac {\left(x-\mu \right)^{2}}{2\sigma ^{2}}}\right)\!$
Función de distribución	${\frac {1}{2}}\left(1+\mathrm {erf} \,{\frac {x-\mu }{\sigma {\sqrt {2}}}}\right)\!$
Media	$\mu$
Mediana	$\mu$
Moda	$\mu$
Varianza	$\sigma ^{2}$
Asimetría	0
Curtose	0
Entropía	$\ln \left(\sigma {\sqrt {2\,\pi \,e}}\right)\!$
F. xeradora de momentos	$M_{X}(t)=\exp \left(\mu \,t+{\frac {\sigma ^{2}t^{2}}{2}}\right)$
Func. caract.	$\phi _{X}(t)=\exp \left(\mu \,i\,t-{\frac {\sigma ^{2}t^{2}}{2}}\right)$

A distribución normal ou distribución gaussiana é a distribución de probabilidade que con máis frecuencia aparece na estatística e na teoría de probabilidades. Isto débese a dúas razóns fundamentalmente:

A súa función de densidade é simétrica e con forma de campá, o que favorece a súa aplicación como modelo a gran número de variables estatísticas.
É ademais límite doutras distribucións e aparece relacionada con multitude de resultados ligados á teoría das probabilidades grazas ás súas propiedades matemáticas.

É unha familia de distribucións coa mesma forma xeral que se diferenza nos seus parámetros de localización e escala: a media ("valor esperado") e a desviación estándar ("variabilidade"), respectivamente.

A función de densidade está dada por:

P(x)={1 \over \sigma {\sqrt {2\pi }}}e^{-(x-\mu )^{2}/2\sigma ^{2}}

onde $\mu$ é a media e $\sigma$ é a desviación estándar ( $\sigma ^{2}$ é a varianza).

A distribución normal estándar é a distribución normal con media cero e desviación estándar un (as liñas verdes nos gráficos da dereita). A miúdo chámaselle curva de campá xa que a gráfica da súa densidade de probabilidade semella unha campá.

Resumo

A distribución normal é un modelo conveniente en fenómenos da natureza e en ciencias do comportamento. Unha gran variedade de tests psicolóxicos e fenómenos físicos como a conta de fotóns seguen unha distribución normal. Mentres non se coñecen as causas destes fenómenos, o uso da distribución normal pode xustificarse teoricamente en situacións nas que se engaden moitos pequenos efectos a unha variable que pode ser observada. A distribución normal tamén aparece en moitas áreas da estatística: por exemplo, a distribución mostral da media é aproximadamente normal, aínda que a distribución da poboación da mostra non sexa normal. A distribución normal maximiza a entropía da información entre tódalas distribucións con media e varianza coñecida, o cal a fai a escolla natural de distribución de datos resumidos en termos de media e varianza. A distribución normal é a familia máis usada de distribución en estatística, e moitos tests estatísticos están baseados na suposición de normalidade. Na teoría da probabilidade, as distribucións normais aparecen como as distribucións límite de varias familias de distribucións continuas e discretas.

Historia

A distribución normal foi introducida por primeira vez por de Moivre nun artigo no 1733 (reimpreso na segunda edición do seu The Doctrine of Chances, 1738) no contexto de aproximar certas distribucións binomiais para un n grande. O seu resultado foi ampliado por Laplace no seu libro Théorie analytique des probabilités (1812), e agora chámase teorema de Moivre-Laplace.

Laplace usou a distribución normal na análise de erros nos experimentos. O método dos mínimos cadrados foi introducido por Legendre en 1805. Gauss, que reclamaba ter usado o método dende o 1794, xustificouno rigorosamente no 1809 asumindo unha distribución normal dos erros.

O nome "curva de campá" remóntase a Jouffret que usou o vocábulo no 1872 para unha distribución normal bivariable con compoñentes independentes. O nome "distribución normal" foi acuñado independentemente por Charles S. Peirce, Francis Galton e Wilhelm Lexis arredor do ano 1875. Esta terminoloxía é desafortunada, xa que reflicte e incrementa a falacia de que todas as distribucións de probabilidade son "normais".

A cuestión de que a distribución se chame normal ou Gaussiana ten relación coa lei de Stigler: "Ningún descubrimento científico recibe o nome despois do seu descubridor orixinal".

Especificacións da distribución normal

Existen varias formas de especificar unha variable aleatoria. A máis visual é a función de densidade de probabilidade (gráfica superior), que representa a probabilidade de cada valor da variable aleatoria. A función de densidade acumulativa (función de distribución, integral da función de densidade de probabilidade), é unha forma máis clara conceptualmente de especificar a mesma información, pero para un ollo non adestrado a gráfica é moito menos informativa. Formas equivalentes de especificar a distribución normal son: os momentos, a función característica, a función xeradora de momentos. Algúns son útiles para o traballo teórico, pero non son intuitivos.

Función densidade de probabilidade

A función de densidade de probabilidade da distribución normal con media $\mu$ e varianza $\sigma ^{2}$ (equivalentemente, desviación estándar $\sigma$ ) é un exemplo dunha función Gaussiana,

f(x;\mu ,\sigma )={\frac {1}{\sigma {\sqrt {2\pi }}}}\,\exp \left(-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}\right).

Se unha variable aleatoria $X$ ten esta distribución, escribimos $X$ ~ $N(\mu ,\sigma ^{2})$ .

Se $\mu =0$ e $\sigma =1$ , a distribución chámase distribución normal estándar e a función de densidade de probabilidade redúcese a

f(x)={\frac {1}{\sqrt {2\pi }}}\,\exp \left(-{\frac {x^{2}}{2}}\right).

A imaxe da dereita mostra a gráfica dunha función de densidade de probabilidade dunha distribución normal con varios conxuntos de parámetros.

Algunhas calidades importantes da distribución normal son:

A función de densidade é simétrica respecto á media.
A media tamén é a moda e a mediana.
68.27% da área baixo a curva está dentro do rango dunha desviación estándar respecto á media.
95.45% da área baixo a curva está dentro do rango de dúas desviacións estándar respecto á media.
99.73% da área está dentro do rango de tres desviacións estándar.
O punto de inflexión da curva ocorre a unha desviación estándar de distancia respecto á media..

Función de distribución

A función de distribución (en inglés, cdf) defínese como a probabilidade de que a variable $X$ teña un valor menor ou igual a $x$ , e é expresado en termos de función de densidade como

F(x;\mu ,\sigma )={\frac {1}{\sigma {\sqrt {2\pi }}}}\int _{-\infty }^{x}\exp -{\frac {(u-\mu )^{2}}{2\sigma ^{2}}}\,du.

A función de distribución da normal estándar, representada normalmente como $\Phi$ , é a función de distribución xeral con $\mu =0$ e $\sigma =1$ ,

\Phi (z)=F(x;0,1)={\frac {1}{\sqrt {2\pi }}}\int _{-\infty }^{z}\exp \left(-{\frac {x^{2}}{2}}\right)\,dx.

Esta función pode expresarse en termos dunha función especial chamada función erro, como

\Phi (z)={\frac {1}{2}}\left[1+\operatorname {erf} \left({\frac {z}{\sqrt {2}}}\right)\right].

A función de distribución inversa, pode expresarse en termos da función inversa de erro:

\Phi ^{-1}(p)={\sqrt {2}}\;\operatorname {erf} ^{-1}\left(2p-1\right).

Esta función chámase ás veces función probit.

Os valores de Φ(x) poden aproximarse bastante mediante varios métodos, como integración numérica, series de Taylor ou series asintóticas.

Funcións xeradoras

Función xeradora de momentos

A función xeradora de momentos defínese como o valor esperado de $\exp(tX)$ . Para unha distribución normal, pódese ver que a función xeradora de momentos é

$M_{X}(t)\,$	$=\mathrm {E} \left[\exp(tX)\right]$
	$=\int _{-\infty }^{\infty }{\frac {1}{\sigma {\sqrt {2\pi }}}}\exp \left(-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}\right)\exp(tx)\,dx$
	$=\exp \left(\mu t+\sigma ^{2}{\frac {t^{2}}{2}}\right)$

como pode verse completando o cadrado no expoñente.

Función característica

A función característica defínese como o valor esperado de $\exp(itX)$ , onde $i$ é a unidade imaxinaria e $i={\sqrt {-1}}$ . Para a distribución normal, a función característica é

$\phi _{X}(t;\mu ,\sigma )\!$	$=\mathrm {E} \left[\exp(itX)\right]$
	$=\int _{-\infty }^{\infty }{\frac {1}{\sigma {\sqrt {2\pi }}}}\exp \left(-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}\right)\exp(itx)\,dx$
	$=\exp \left(i\mu t-{\frac {\sigma ^{2}t^{2}}{2}}\right).$

A función característica obtense substituíndo $t$ por $it$ na función xeradora de momentos.

Propiedades

Algunhas das propiedades da distribución normal son:

É simétrica respecto á súa media $\mu$ .
A moda e a mediana son iguais á media.
Presenta dous puntos de inflexión en $x=\mu -\sigma$ e $x=\mu +\sigma$ .
Se $X\sim N(\mu ,\sigma ^{2})$ e $a$ e $b$ son números reais, entón $aX+b\sim N(a\mu +b,(a\sigma )^{2})$ .
Se $X\sim N(\mu _{X},\sigma _{X}^{2})$ $X\sim N(\mu _{X},\sigma _{X}^{2})$ e $Y\sim N(\mu _{Y},\sigma _{Y}^{2})$ $Y\sim N(\mu _{Y},\sigma _{Y}^{2})$ son variables aleatorias normais e independentes entón:
- A súa suma é normalmente distribuída con $U=X+Y\sim N(\mu _{X}+\mu _{Y},\sigma _{X}^{2}+\sigma _{Y}^{2})$ .
- A súa diferenza é normalmente distribuída con $V=X-Y\sim N(\mu _{X}-\mu _{Y},\sigma _{X}^{2}+\sigma _{Y}^{2})$ .
- Ambas $U$ e $V$ son independentes unha da outra.
Se $X\sim N(0,\sigma _{X}^{2})$ $X\sim N(0,\sigma _{X}^{2})$ e $Y\sim N(0,\sigma _{Y}^{2})$ $Y\sim N(0,\sigma _{Y}^{2})$ son variables aleatorias normales e independentes, entón:
- O seu produto $XY$ segue unha distribución con densidade $p$ dada por #*: $p(z)={\frac {1}{\pi \,\sigma _{X}\,\sigma _{Y}}}\;K_{0}\left({\frac {|z|}{\sigma _{X}\,\sigma _{Y}}}\right),$ onde $K_{0}$ é unha función de Bessel modificada.
- A súa razón segue unha distribución de Cauchy con $X/Y\sim \mathrm {Cauchy} (0,\sigma _{X}/\sigma _{Y})$ .
Se $X_{1},\cdots ,X_{n}$ son variables independentes estándar e normais, entón $X_{1}^{2}+\cdots +X_{n}^{2}$ segue unha distribución khi cadrado con n graos de liberdade.

Estandarización de variables aleatorias normais

Como consecuencia das propiedades anteriores, é posible relacionar tódalas variables aleatorias normales coa normal estándar.

Se $X$ ~ $N(\mu ,\sigma ^{2})$ , entón

Z={\frac {X-\mu }{\sigma }}\!

é unha variable aleatoria normal estándar: $Z$ ~ $N(0,1)$ . Unha consecuencia importante é que a función de distribución dunha distribución normal é entón

\Pr(X\leq x)=\Phi \left({\frac {x-\mu }{\sigma }}\right)={\frac {1}{2}}\left(1+\operatorname {erf} \left({\frac {x-\mu }{\sigma {\sqrt {2}}}}\right)\right).

Igualmente, se $Z$ ~ $N(0,1)$ , entón

X=\sigma Z+\mu

é unha variable aleatoria normal con media $\mu$ e varianza $\sigma ^{2}$ .

A distribución estándar normal está tabulada, e as outras distribucións normais son simples transformacións da estándar. Polo tanto, pódense utilizar valores tabulados da función de distribución da normal estándar para atopar os valores da función de distribución dunha normal xeral.

Momentos

Algúns dos primeiros momentos da distribución normal son:

Número	Raw moment	Momento central	Cumulant
0	1	0
1	$\mu$	0	$\mu$
2	$\mu ^{2}+\sigma ^{2}$	$\sigma ^{2}$	$\sigma ^{2}$
3	$\mu ^{3}+3\mu \sigma ^{2}$	0	0
4	$\mu ^{4}+6\mu ^{2}\sigma ^{2}+3\sigma ^{4}$	$3\sigma ^{4}$	0

Tódolos cumulantes da distribución normal despois do segundo son cero.

Véxase tamén

Bibliografía

John Aldrich. Earliest Uses of Symbols in Probability and Statistics ("Symbols associated with the Normal Distribution"). Documento electrónico, consultado o 20 de marzo de 2005.
Abraham de Moivre (1738). The Doctrine of Chances.
Stephen Jay Gould (1981). The Mismeasure of Man. 1ª edición. W. W. Norton. ISBN 0-393-01489-4.
R. J. Herrnstein e Charles Murray (1994). The Bell Curve: Intelligence and Class Structure in American Life. Free Press. ISBN 0-02-914673-9.
Pierre Simon Laplace (1812). Théorie analytique des probabilités.
Jeff Miller et al. Earliest Known Uses of Some of the Words of Mathematics. En particular as entradas para "normal" (distribution) por John Aldrich, "Gaussian", e "Error, law of error, theory of errors etc.". Documentos electrónicos, consultados o 20 de marzo de 2005.
S. M. Stigler (1999). Statistics on the Table, capítulo 22. Harvard University Press. (History of the term "normal distribution".)
Eric W. Weisstein et al. Normal Distribution en MathWorld. Documento electrónico, consultado o 20 de marzo de 2005.
Marvin Zelen e Norman C. Severo (1964). Probability Functions. Capítulo 26 de Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables, editado por Milton Abramowitz e Irene A. Stegun. National Bureau of Standards.

Outros artigos

Ligazóns externas

basic tools for sixsigma
PlanetMath: normal random variable Arquivado 16 de maio de 2008 en Wayback Machine.
GNU Scientific Library – Reference Manual – The Gaussian Distribution
Distribution Calculator – Calculates probabilities and critical values for normal, t, chi-square and F-distribution.
Public Domain Normal Distribution Table
Is normal distribution due to Karl Gauss? Euler, his family of gamma functions, and place in history of statistics
Maxwell demons: Simulating probability distributions with functions of propositional calculus