Desviación típica

En probabilidade e estatística, a desviación típica ou estándar é a medida máis común de dispersión. De xeito sinxelo, mide como están de dispersos os valores nunha colección de datos. Máis raramente aparece referida como desviación padrón^[1] ou desvío^[2] (típico, estándar, padrón...).^[3]

A desviación estándar está definida como a raíz cadrada da varianza. Defínese desta maneira para dar unha medida da dispersión que é un número non negativo que ten as mesmas unidades que os datos.

O termo desviación estándar foi introducido en estatística por Karl Pearson en 1894.

Interpretación e aplicación[editar | editar a fonte]

A desviación estándar é unha medida do grao de dispersión dos datos do valor medio. Dito doutra maneira, a desviación estándar é simplemente a "media" ou variación esperada con respecto da media aritmética.

Unha desviación estándar grande indica que os puntos están lonxe da media e unha desviación pequeno indica que os datos están agrupados cerca da media.

Por exemplo, as tres mostras (0, 0, 14, 14), (0, 6, 8, 14) e (6, 6, 8, 8) cada unha teñen unha media de 7. As súas desviacións estándar son 7, 5 e 1, respectivamente. A terceira mostra ten unha desviación moito menor que as outras dúas porque os seus valores están máis próximos a 7.

A desviación estándar pode ser interpretado como unha medida de incerteza. A desviación estándar dun grupo repetido de medidas dá a precisión destas. Cando se vai determinar se un grupo de medidas está de acordo co modelo teórico, a desviación estándar desas medidas é de vital importancia: se a media das medidas está demasiado afastada da predición (coa distancia medida en desviacións estándar), entón considérase que as medidas contradín a teoría. Isto é de esperarse xa que as medicións caen fóra do rango de valores dos cales sería razoable esperar que ocorresen se o modelo teórico fose correcto.

Formulación[editar | editar a fonte]

A desviación estándar (DS/DE) é unha medida de dispersión usada en estatística que indica canto tenden a afastarse os valores puntuais da media nunha distribución. De feito, especificamente a desviación estándar é "a media da distancia de cada punto respecto do valor medio". Adóitase representar por un S ou coa letra sigma, $\sigma _{}^{}$ . Esta medida é máis estable que o percorrido e toma en consideración o valor de cada dato.

É posible calcular a desviación estándar como a raíz cadrada da integral

{\sigma }^{2}=\int _{-\infty }^{\infty }{(x-\mu )}^{2}f(x)dx

onde

\mu =\int _{-\infty }^{\infty }xf(x)dx

O DS é a raíz cadrada da varianza da distribución

\sigma ^{2}=\lim _{n\to \infty }{\frac {1}{n}}\sum _{i=1}^{n}\left(x_{i}-{\overline {x}}\right)^{2}

Así a varianza é a media dos cadrados das diferenzas entre cada valor da variable e a media aritmética da distribución.

Aínda que esta fórmula é correcta, na práctica interesa realizar inferencias de poboación, polo que no denominador en vez de n, úsase n-1 (Corrección de Bessel)

s^{2}={\frac {\sum _{i=1}^{n}\left(x_{i}-{\overline {x}}\right)^{2}}{n-1}}

Tamén temos outra función máis sinxela de realizar e con menos risco de ter equivocacións:

s^{2}={\frac {\sum _{i=1}^{n}x_{i}^{2}}{n-1}}-{\overline {x}}^{2}

Exemplo[editar | editar a fonte]

Aquí móstrase como calcular a desviación estándar dun conxunto de datos. Os datos representan a idade dos membros dun grupo de nenos. { 5, 6, 8, 9 }

1. Calcular a media ${\overline {x}}$ .

{\overline {x}}={\frac {1}{N}}\sum _{i=1}^{N}x_{i}

.

Neste caso, N = 4 porque hai catro datos:

x_{1}=5\,\!

x_{2}=6\,\!

x_{3}=8\,\!

x_{4}=9\,\!

{\overline {x}}={\frac {1}{4}}\sum _{i=1}^{4}x_{i}

Substituíndo N por 4

{\overline {x}}={\frac {1}{4}}\left(x_{1}+x_{2}+x_{3}+x_{4}\right)

{\overline {x}}={\frac {1}{4}}\left(5+6+8+9\right)

{\overline {x}}=7

Esta é a media.

2. Calcular a desviación estándar $\sigma \,\!$

\sigma ={\sqrt {{\frac {1}{N}}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}}}

\sigma ={\sqrt {{\frac {1}{4}}\sum _{i=1}^{4}(x_{i}-{\overline {x}})^{2}}}

Substituíndo N por 4

\sigma ={\sqrt {{\frac {1}{4}}\sum _{i=1}^{4}(x_{i}-7)^{2}}}

Substituíndo

{\overline {x}}

por 7

\sigma ={\sqrt {{\frac {1}{4}}\left[(5-7)^{2}+(6-7)^{2}+(8-7)^{2}+(9-7)^{2}\right]}}

\sigma ={\sqrt {{\frac {1}{4}}\left((-2)^{2}+(-1)^{2}+1^{2}+2^{2}\right)}}

\sigma ={\sqrt {{\frac {1}{4}}\left(4+1+1+4\right)}}

\sigma ={\sqrt {\frac {10}{4}}}

\sigma =1.5811\,\!

Esta é a desviación estándar.

Notas[editar | editar a fonte]

↑ Definicións no Dicionario da Real Academia Galega e no Portal das Palabras para desviación.
↑ Definicións no Dicionario da Real Academia Galega e no Portal das Palabras para desvío.
↑ Masa Vázquez, Xosé M.; Fortes López, Belén (1995). Vocabulario de Matemáticas. Servizo de Normalización Lingüística da Universidade de Santiago de Compostela. ISBN 84-8121-369-1.

Véxase tamén[editar | editar a fonte]

Outros artigos[editar | editar a fonte]

[1] Definicións no Dicionario da Real Academia Galega e no Portal das Palabras para desviación.

[2] Definicións no Dicionario da Real Academia Galega e no Portal das Palabras para desvío.

[masa-3] Masa Vázquez, Xosé M.; Fortes López, Belén (1995). Vocabulario de Matemáticas. Servizo de Normalización Lingüística da Universidade de Santiago de Compostela. ISBN 84-8121-369-1.

[1]

[2]

[3]