Desvío estándar

Na Galipedia, a Wikipedia en galego.

En probabilidade e estatística, o desvío estándar é a medida máis común de dispersión. Dito de xeito sinxelo, mide qué tan dispersos están os valores en unha colección de datos.

O desvío estándar está definida como a raíz cadrada da varianza. Defínese de esta maneira para darnos unha medida da dispersión que é (1) un número non negativo e (2) ten as mesmas unidades que os datos.

O termo desvío estándar foi introducido en estatística por Karl Pearson en 1894.

Interpretación e aplicación[editar | editar a fonte]

O desvío estándar é unha medida do grao de dispersión dos datos do valor medio. Dito doutra maneira, o desvío estándar é simplemente a "media" ou variación esperada con respecto da media aritmética.

Un desvío estándar grande indica que os puntos están lonxe da media e un desvío pequeno indica que os datos están agrupados cerca da media.

Por exemplo, as tres mostras (0, 0, 14, 14), (0, 6, 8, 14) e (6, 6, 8, 8) cada unha teñen unha media de 7. Os seus desvíos estándar son 7, 5 e 1, respectivamente. A terceira mostra ten un desvío moito menor que as outras dúas porque os seus valores están máis próximas a 7.

O desvío estándar pode ser interpretada como unha medida de incerteza. O desvío estándar de un grupo repetido de medidas danos a precisión de estas. Cando se vai determinar se un grupo de medidas está de acordo co modelo teórico, o desvío estándar desas medidas é de vital importancia: se a media das medidas está demasiado afastada da predición (coa distancia medida en desvíos estándar), entón consideramos que as medidas contradín a teoría. Isto é de esperarse xa que as medicións caen fora do rango de valores dos cales sería razoable esperar que ocorresen se o modelo teórico fora correcto.

Formulación[editar | editar a fonte]

O desvío estándar (DS/DE), tamén coñecida como desvío típico, é unha medida de dispersión usada en estatística que indica canto tenden a afastarse os valores puntuais do promedio nunha distribución. De feito, especificamente o desvío estándar é "a medio da distancia de cada punto respecto do valor medio". Sóese representar por unha S ou coa letra sigma, \sigma^{}_{}.

O desvío estándar dun conxunto de datos é unha medida de canto se desvían os datos da súa media. Esta medida é máis estable que o percorrido e toma en consideración o valor de cada dato.

É posible calcular o desvío estándar como a raíz cadrada da integral

{\sigma}^2 = \int_{-\infty}^\infty {(x - \mu)}^2 f(x) dx

onde

\mu = \int_{-\infty}^\infty x f(x) dx
  • A DS é a raíz cadrada da varianza da distribución
\sigma^2 = \lim_{n \to \infty} \frac{1}{n} \sum_{i=1}^n
 \left( x_i - \overline{x} \right) ^ 2

Así a varianza é a media dos cadrados das diferencias entre cada valor da variable e a media aritmética da distribución.

Aínda que esta fórmula é correcta, na práctica interesa realizar inferencias poboacionais, polo que no denominador en vez de n, úsase n-1 (Corrección de Bessel)

s^2 = \frac{ \sum_{i=1}^n \left( x_i - \overline{x} \right) ^ 2 }{n-1}

Tamén temos outra función máis sinxela de realizar e con menos risco de ter equivocacións:

s^2 = \frac{ \sum_{i=1}^n x_i^2 }{n-1} - \overline{x}^2

Exemplo[editar | editar a fonte]

Aquí móstrase como calcular o desvío estándar de un conxunto de datos. Os datos representan a idade dos membros de un grupo de nenos. { 5, 6, 8, 9 }

1. Calcular o medio \overline{x}.

\overline{x}=\frac{1}{N}\sum_{i=1}^N x_i.

Neste caso, N = 4 porque hai catro datos:

x_1 = 5\,\!
x_2 = 6\,\!
x_3 = 8\,\!
x_4 = 9\,\!
\overline{x}=\frac{1}{4}\sum_{i=1}^4 x_i       Substituíndo N por 4
\overline{x}=\frac{1}{4} \left ( x_1 + x_2 + x_3 +x_4 \right )
\overline{x}=\frac{1}{4} \left ( 5 + 6 + 8 + 9 \right )
\overline{x}= 7   Esta é a media.


2. Calcular o desvío estándar \sigma\,\!

\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2}
\sigma = \sqrt{\frac{1}{4} \sum_{i=1}^4 (x_i - \overline{x})^2}       Substituíndo N por 4
\sigma = \sqrt{\frac{1}{4} \sum_{i=1}^4 (x_i - 7)^2}       Substituíndo \overline{x} por 7
\sigma = \sqrt{\frac{1}{8} \left [ (4.589-4.596)^2 + (4.318-4.596)^2 + (4.256-4.596)^2 + (4.624-4.596)^2+(4.903-4.596)^2+(4.867-4.596)^2+(4.420-4.596)^2 +(4.790-4.596)^2\right ] }
\sigma = \sqrt{\frac{1}{4} \left [ (5 - 7)^2 + (6 - 7)^2 + (8 - 7)^2 + (9 - 7)^2 \right ] }
\sigma = \sqrt{\frac{1}{4} \left ( (-2)^2 + (-1)^2 + 1^2 + 2^2 \right ) }
\sigma = \sqrt{\frac{1}{4} \left ( 4 + 1 + 1 + 4 \right ) }
\sigma = \sqrt{\frac{10}{4}}
\sigma = 1.5811\,\!   Este é o desvío estándar.

Véxase tamén[editar | editar a fonte]

Outros artigos[editar | editar a fonte]