Desvío estándar
En probabilidade e estatística, o desvío estándar é a medida máis común de dispersión. Dito de xeito sinxelo, mide qué tan dispersos están os valores en unha colección de datos.
O desvío estándar está definida como a raíz cadrada da varianza. Defínese de esta maneira para darnos unha medida da dispersión que é (1) un número non negativo e (2) ten as mesmas unidades que os datos.
O termo desvío estándar foi introducido en estatística por Karl Pearson en 1894.
Índice |
Interpretación e aplicación [editar]
O desvío estándar é unha medida do grao de dispersión dos datos do valor medio. Dito doutra maneira, o desvío estándar é simplemente a "media" ou variación esperada con respecto da media aritmética.
Un desvío estándar grande indica que os puntos están lonxe da media e un desvío pequeno indica que os datos están agrupados cerca da media.
Por exemplo, as tres mostras (0, 0, 14, 14), (0, 6, 8, 14) e (6, 6, 8, 8) cada unha teñen unha media de 7. Os seus desvíos estándar son 7, 5 e 1, respectivamente. A terceira mostra ten un desvío moito menor que as outras dúas porque os seus valores están máis próximas a 7.
O desvío estándar pode ser interpretada como unha medida de incerteza. O desvío estándar de un grupo repetido de medidas danos a precisión de estas. Cando se vai determinar se un grupo de medidas está de acordo co modelo teórico, o desvío estándar desas medidas é de vital importancia: se a media das medidas está demasiado afastada da predición (coa distancia medida en desvíos estándar), entón consideramos que as medidas contradín a teoría. Isto é de esperarse xa que as medicións caen fora do rango de valores dos cales sería razoable esperar que ocorresen se o modelo teórico fora correcto.
Formulación [editar]
O desvío estándar (DS/DE), tamén coñecida como desvío típico, é unha medida de dispersión usada en estatística que indica canto tenden a afastarse os valores puntuais do promedio nunha distribución. De feito, especificamente o desvío estándar é "a medio da distancia de cada punto respecto do valor medio". Sóese representar por unha S ou coa letra sigma,
.
O desvío estándar dun conxunto de datos é unha medida de canto se desvían os datos da súa media. Esta medida é máis estable que o percorrido e toma en consideración o valor de cada dato.
É posible calcular o desvío estándar como a raíz cadrada da integral
onde
- A DS é a raíz cadrada da varianza da distribución
Así a varianza é a media dos cadrados das diferencias entre cada valor da variable e a media aritmética da distribución.
Aínda que esta fórmula é correcta, na práctica interesa realizar inferencias poboacionais, polo que no denominador en vez de n, úsase n-1 (Corrección de Bessel)
Tamén temos outra función máis sinxela de realizar e con menos risco de ter equivocacións:
Exemplo [editar]
Aquí móstrase como calcular o desvío estándar de un conxunto de datos. Os datos representan a idade dos membros de un grupo de nenos. { 5, 6, 8, 9 }
1. Calcular o medio
.
.
Neste caso, N = 4 porque hai catro datos:
Substituíndo N por 4
Esta é a media.
2. Calcular o desvío estándar 
Substituíndo N por 4
Substituíndo
por 7
Este é o desvío estándar.





.



Substituíndo N por 4

Esta é a media.
Substituíndo N por 4
Substituíndo ![\sigma = \sqrt{\frac{1}{8} \left [ (4.589-4.596)^2 + (4.318-4.596)^2 + (4.256-4.596)^2 + (4.624-4.596)^2+(4.903-4.596)^2+(4.867-4.596)^2+(4.420-4.596)^2 +(4.790-4.596)^2\right ] }](http://upload.wikimedia.org/math/7/0/a/70a0dbfb524620f76a5427ff69f44568.png)
![\sigma = \sqrt{\frac{1}{4} \left [ (5 - 7)^2 + (6 - 7)^2 + (8 - 7)^2 + (9 - 7)^2 \right ] }](http://upload.wikimedia.org/math/6/5/6/6560ac4b798b90789db7a4248692077e.png)



Este é o desvío estándar.