Desvío estándar
En probabilidade e estatística, o desvío estándar é a medida máis común de dispersión. Dito de xeito sinxelo, mide qué tan dispersos están os valores en unha colección de datos.
O desvío estándar está definida como a raíz cadrada da varianza. Defínese de esta maneira para darnos unha medida da dispersión que é (1) un número non negativo e (2) ten as mesmas unidades que os datos.
O termo desvío estándar foi introducido en estatística por Karl Pearson en 1894.
Índice |
[editar] Interpretación e aplicación
O desvío estándar é unha medida do grao de dispersión dos datos do valor promedio. Dito de otra maneira, o desvío estándar é simplemente o "promedio" ou variación esperada con respecto da media aritmética.
Un desvío estándar grande indica que os puntos están lonxe da media e un desvío pequeno indica que os datos están agrupados cerca da media.
Por exemplo, as tres mostras (0, 0, 14, 14), (0, 6, 8, 14) e (6, 6, 8, 8) cada unha teñen unha media de 7. Os seus desvíos estándar son 7, 5 e 1, respectivamente. A terceira mostra ten un desvío moito menor que as outras duas porque os seus valores están máis cerca de 7.
O desvío estándar pode ser interpretada como unha medida de incertidume. O desvío estándar de un grupo repetido de medidas danos a precisión de estas. Cando se vai determinar se un grupo de medidas está de acordo co modelo teórico, o desvío estándar desas medidas é de vital importancia: se a media das medidas está demasiado alonxada da predición (coa distancia medida en desvíos estándar), entón consideramos que as medidas contradicen a teoría. Isto é de esperarse xa que as medicións caen fora do rango de valores dos cuales sería razoable esperar que ocurreran se o modelo teórico fora correcto.
[editar] Desglose
O desvío estándar (DS/DE), tamén coñecida como desvío típico, é unha medida de dispersión usada en estatística que nos dice cánto tenden a alonxarse os valores puntuales do promedio nunha distribución. De feito, especificamente o desvío estándar é "o promedio da distancia de cada punto respecto do promedio". Sóese representar por unha S ou coa letra sigma,
.
O desvío estándar dun conxunto de datos é unha medida de cánto se desvían os datos da súa media. Esta medida é máis estable que o percorrido e toma en consideración o valor de cada dato.
É posible calcular o desvío estándar como a raíz cadrada da integral
onde
- A DS é a raíz cadrada da varianza da distribución
Así a varianza é a media dos cadrados das diferencias entre cada valor da variable e a media aritmética da distribución.
Aínda que esta fórmula é correcta, na práctica interesa realizar inferencias poboacionais, polo que no denominador en vez de n, úsase n-1 (Corrección de Bessel)
Tamén temos outra función máis sinxela de realizar e con menos risco de ter equivocacións:
[editar] Exemplo
Aquí móstrase cómo calcular o desvío estándar de un conxunto de datos. Os datos representan a idade dos membros de un grupo de nenos. { 5, 6, 8, 9 }
1. Calcular o promedio
.
.
Neste caso, N = 4 porque temos catro datos:
Sustituindo N por 4
Este é o promedio.
2. Calcular o desvío estándar 
Sustituindo N por 4
Sustituindo
por 7
Este é o desvío estándar.





.



Sustituindo N por 4

Este é o promedio.
Sustituindo N por 4
Sustituindo ![\sigma = \sqrt{\frac{1}{8} \left [ (4.589-4.596)^2 + (4.318-4.596)^2 + (4.256-4.596)^2 + (4.624-4.596)^2+(4.903-4.596)^2+(4.867-4.596)^2+(4.420-4.596)^2 +(4.790-4.596)^2\right ] }](http://upload.wikimedia.org/wikipedia/gl/math/7/0/a/70a0dbfb524620f76a5427ff69f44568.png)
![\sigma = \sqrt{\frac{1}{4} \left [ (5 - 7)^2 + (6 - 7)^2 + (8 - 7)^2 + (9 - 7)^2 \right ] }](http://upload.wikimedia.org/wikipedia/gl/math/6/5/6/6560ac4b798b90789db7a4248692077e.png)



Este é o desvío estándar.