Distribución t de Student
Función de densidade | |
Función de distribución | |
Parámetros | graos de liberdade (real) |
Soporte | |
Función de densidade | |
Función de distribución | onde é a función hiperxeométrica |
Media | para , indefinida para outros valores |
Mediana | |
Moda | |
Varianza | para , indefinida para outros valores |
Asimetría | para |
Curtose | para |
Entropía |
|
F. xeradora de momentos | (Non definida) |
Func. caract. |
A distribución t (de Student) é unha distribución de probabilidade que xorde do problema de estimar a media dunha poboación normalmente distribuída cando o tamaño da mostra é pequeno.
Aparece de xeito natural ao realizar a proba t de Student para a determinación das diferenzas entre dúas medias das mostras e para a construción do intervalo de confianza para a diferenza entre as medias de dúas poboacións cando se descoñece o desvío estándar dunha poboación e esta debe ser estimada a partir dos datos dunha mostra.
Caracterización
[editar | editar a fonte]A distribución t de Student é a distribución de probabilidade do cociente
onde
- Z é unha variable aleatoria distribuída segundo unha normal típica (de media nula e varianza 1).
- V é unha variable aleatoria que segue unha distribución χ² con graos de liberdade.
- Z e V son independentes
Se μ é unha constante non nula, o cociente é unha variable aleatoria que segue a distribución t de Student non central con parámetro de non-centralidade .
Aparición e especificacións da distribución t de Student
[editar | editar a fonte]Supóñase que X1,..., Xn son variables aleatorias independentes distribuídas normalmente, con media μ e varianza σ2
Sexa
a media da mostra. Entón
segue unha distribución normal de media 0 e varianza 1.
Non obstante, dado que o desvío estándar non sempre se coñece previamente, Gosset estudou un cociente relacionado,
é a varianza da mostra e demostrou que a función de densidade de T é
onde é igual a n − 1.
A distribución de T chámase agora a distribución-t de Student.
O parámetro representa o número de graos de liberdade. A distribución depende de , pero non de ou , o que é moi importante na práctica.
Intervalos de confianza derivados da distribución t de Student
[editar | editar a fonte]O procedemento para o cálculo do intervalo de confianza baseado na t de Student consiste en estimar o desvío estándar dos datos S e calcular o erro estándar da media: , sendo entón o intervalo de confianza para a media: .
Este resultado é o que se emprega no test de Student: posto que a diferenza das medias de mostras de dúas distribucións normais distribúese tamén normalmente, a distribución t pode empregarse para examinar se esa diferenza se pode supor razoablemente igual a cero.
Para efectos prácticos o valor esperado e a varianza son:
e para e para e para e para
Historia
[editar | editar a fonte]A distribución de Student foi descrita en 1908 por William Sealy Gosset. Gosset traballaba nunha fábrica de cervexa, Guinness, que prohibía aos seus empregados a publicación de artigos científicos debido a unha difusión previa de segredos industriais. Por ese motivo, Gosset publicou os seus resultados baixo o pseudónimo de Student (“estudante”).[1]
Distribución t de Student non estandarizada
[editar | editar a fonte]A distribución t pode xeralizarse a 3 parámetros, introducindo un parámero locacional e outro de escala . O resultado é unha distribución t de Student non estandarizada cunha densidade que está definida por:[2]
Equivalentemente, pode escribirse en termos de (correspondente á varianza en vez de ao desvío estándar):
Outras propiedades desta versión da distribución t son:[2]
Notas
[editar | editar a fonte]- ↑ Walpole, Roland; Myers, Raymond; Ye, Keying (2002). "Probability and Statistics for Engineers and Scientists". Pearson Education.
- ↑ 2,0 2,1 Jackman, Simon (2009). Bayesian Analysis for the Social Sciences. Wiley. pp. 507.