Saltar ao contido

Distribución normal

Na Galipedia, a Wikipedia en galego.
Normal
Función de densidade
Función densidade de probabilidade da distribución Normal
As catro distribucións do gráfico son normais, con distintos valores da media e a desviación típica. A verde é a "normal reducida", de media cero e desviación típica un
Función de distribución
Función de distribución acumulativa da distribución Normal
As cores son as mesmas das funcións de probabilidade de arriba
Parámetros localización (real)
cadrado escala (real)
Soporte
Función de densidade
Función de distribución
Media
Mediana
Moda
Varianza
Asimetría 0
Curtose 0
Entropía
F. xeradora de momentos
Func. caract.

A distribución normal ou distribución gaussiana é a distribución de probabilidade que con máis frecuencia aparece na estatística e na teoría de probabilidades. Isto débese a dúas razóns fundamentalmente:

  1. A súa función de densidade é simétrica e con forma de campá, o que favorece a súa aplicación como modelo a gran número de variables estatísticas.
  2. É ademais límite doutras distribucións e aparece relacionada con multitude de resultados ligados á teoría das probabilidades grazas ás súas propiedades matemáticas.

É unha familia de distribucións coa mesma forma xeral que se diferenza nos seus parámetros de localización e escala: a media ("valor esperado") e a desviación estándar ("variabilidade"), respectivamente.

A función de densidade está dada por:

onde é a media e é a desviación estándar ( é a varianza).

A distribución normal estándar é a distribución normal con media cero e desviación estándar un (as liñas verdes nos gráficos da dereita). A miúdo chámaselle curva de campá xa que a gráfica da súa densidade de probabilidade semella unha campá.

A distribución normal é un modelo conveniente en fenómenos da natureza e en ciencias do comportamento. Unha gran variedade de tests psicolóxicos e fenómenos físicos como a conta de fotóns seguen unha distribución normal. Mentres non se coñecen as causas destes fenómenos, o uso da distribución normal pode xustificarse teoricamente en situacións nas que se engaden moitos pequenos efectos a unha variable que pode ser observada. A distribución normal tamén aparece en moitas áreas da estatística: por exemplo, a distribución mostral da media é aproximadamente normal, aínda que a distribución da poboación da mostra non sexa normal. A distribución normal maximiza a entropía da información entre tódalas distribucións con media e varianza coñecida, o cal a fai a escolla natural de distribución de datos resumidos en termos de media e varianza. A distribución normal é a familia máis usada de distribución en estatística, e moitos tests estatísticos están baseados na suposición de normalidade. Na teoría da probabilidade, as distribucións normais aparecen como as distribucións límite de varias familias de distribucións continuas e discretas.

A distribución normal foi introducida por primeira vez por de Moivre nun artigo no 1733 (reimpreso na segunda edición do seu The Doctrine of Chances, 1738) no contexto de aproximar certas distribucións binomiais para un n grande. O seu resultado foi ampliado por Laplace no seu libro Théorie analytique des probabilités (1812), e agora chámase teorema de Moivre-Laplace.

Laplace usou a distribución normal na análise de erros nos experimentos. O método dos mínimos cadrados foi introducido por Legendre en 1805. Gauss, que reclamaba ter usado o método dende o 1794, xustificouno rigorosamente no 1809 asumindo unha distribución normal dos erros.

O nome "curva de campá" remóntase a Jouffret que usou o vocábulo no 1872 para unha distribución normal bivariable con compoñentes independentes. O nome "distribución normal" foi acuñado independentemente por Charles S. Peirce, Francis Galton e Wilhelm Lexis arredor do ano 1875. Esta terminoloxía é desafortunada, xa que reflicte e incrementa a falacia de que todas as distribucións de probabilidade son "normais".

A cuestión de que a distribución se chame normal ou Gaussiana ten relación coa lei de Stigler: "Ningún descubrimento científico recibe o nome despois do seu descubridor orixinal".

Especificacións da distribución normal

[editar | editar a fonte]

Existen varias formas de especificar unha variable aleatoria. A máis visual é a función de densidade de probabilidade (gráfica superior), que representa a probabilidade de cada valor da variable aleatoria. A función de densidade acumulativa (función de distribución, integral da función de densidade de probabilidade), é unha forma máis clara conceptualmente de especificar a mesma información, pero para un ollo non adestrado a gráfica é moito menos informativa. Formas equivalentes de especificar a distribución normal son: os momentos, a función característica, a función xeradora de momentos. Algúns son útiles para o traballo teórico, pero non son intuitivos.

Función densidade de probabilidade

[editar | editar a fonte]
Función densidade de probabilidade para catro conxuntos diferentes de parámetros (a liña verde é a normal estándar)

A función de densidade de probabilidade da distribución normal con media e varianza (equivalentemente, desviación estándar ) é un exemplo dunha función Gaussiana,

Se unha variable aleatoria ten esta distribución, escribimos ~ .

Se e , a distribución chámase distribución normal estándar e a función de densidade de probabilidade redúcese a

A imaxe da dereita mostra a gráfica dunha función de densidade de probabilidade dunha distribución normal con varios conxuntos de parámetros.

Algunhas calidades importantes da distribución normal son:

  • A función de densidade é simétrica respecto á media.
  • A media tamén é a moda e a mediana.
  • 68.27% da área baixo a curva está dentro do rango dunha desviación estándar respecto á media.
  • 95.45% da área baixo a curva está dentro do rango de dúas desviacións estándar respecto á media.
  • 99.73% da área está dentro do rango de tres desviacións estándar.
  • O punto de inflexión da curva ocorre a unha desviación estándar de distancia respecto á media..

Función de distribución

[editar | editar a fonte]
Función de distribución da función de densidade do gráfico superior

A función de distribución (en inglés, cdf) defínese como a probabilidade de que a variable teña un valor menor ou igual a , e é expresado en termos de función de densidade como

A función de distribución da normal estándar, representada normalmente como , é a función de distribución xeral con e ,

Esta función pode expresarse en termos dunha función especial chamada función erro, como

A función de distribución inversa, pode expresarse en termos da función inversa de erro:

Esta función chámase ás veces función probit.

Os valores de Φ(x) poden aproximarse bastante mediante varios métodos, como integración numérica, series de Taylor ou series asintóticas.

Funcións xeradoras

[editar | editar a fonte]

Función xeradora de momentos

[editar | editar a fonte]

A función xeradora de momentos defínese como o valor esperado de . Para unha distribución normal, pódese ver que a función xeradora de momentos é

 
 

como pode verse completando o cadrado no expoñente.

Función característica

[editar | editar a fonte]

A función característica defínese como o valor esperado de , onde é a unidade imaxinaria e . Para a distribución normal, a función característica é

 
 

A función característica obtense substituíndo por na función xeradora de momentos.

Propiedades

[editar | editar a fonte]

Algunhas das propiedades da distribución normal son:

  1. É simétrica respecto á súa media .
  2. A moda e a mediana son iguais á media.
  3. Presenta dous puntos de inflexión en e .
  4. Se e e son números reais, entón .
  5. Se e son variables aleatorias normais e independentes entón:
    • A súa suma é normalmente distribuída con .
    • A súa diferenza é normalmente distribuída con .
    • Ambas e son independentes unha da outra.
  6. Se e son variables aleatorias normales e independentes, entón:
    • O seu produto segue unha distribución con densidade dada por #*: onde é unha función de Bessel modificada.
    • A súa razón segue unha distribución de Cauchy con .
  7. Se son variables independentes estándar e normais, entón segue unha distribución khi cadrado con n graos de liberdade.

Estandarización de variables aleatorias normais

[editar | editar a fonte]

Como consecuencia das propiedades anteriores, é posible relacionar tódalas variables aleatorias normales coa normal estándar.

Se ~ , entón

é unha variable aleatoria normal estándar: ~ . Unha consecuencia importante é que a función de distribución dunha distribución normal é entón

Igualmente, se ~ , entón

é unha variable aleatoria normal con media e varianza .

A distribución estándar normal está tabulada, e as outras distribucións normais son simples transformacións da estándar. Polo tanto, pódense utilizar valores tabulados da función de distribución da normal estándar para atopar os valores da función de distribución dunha normal xeral.

Algúns dos primeiros momentos da distribución normal son:

Número Raw moment Momento central Cumulant
0 1 0
1 0
2
3 0 0
4 0

Tódolos cumulantes da distribución normal despois do segundo son cero.

Véxase tamén

[editar | editar a fonte]

Bibliografía

[editar | editar a fonte]

Outros artigos

[editar | editar a fonte]

Ligazóns externas

[editar | editar a fonte]