Desvío estándar

Na Galipedia, a Wikipedia en galego.

En probabilidade e estatística, o desvío estándar, desvío típico[1] ou desvío padrón[1] é a medida máis común de dispersión. De xeito sinxelo, mide como están de dispersos os valores nunha colección de datos.

O desvío estándar está definida como a raíz cadrada da varianza. Defínese desta maneira para dar unha medida da dispersión que é (1) un número non negativo e (2) ten as mesmas unidades que os datos.

O termo desvío estándar foi introducido en estatística por Karl Pearson en 1894.

Interpretación e aplicación[editar | editar a fonte]

O desvío estándar é unha medida do grao de dispersión dos datos do valor medio. Dito doutra maneira, o desvío estándar é simplemente a "media" ou variación esperada con respecto da media aritmética.

Un desvío estándar grande indica que os puntos están lonxe da media e un desvío pequeno indica que os datos están agrupados cerca da media.

Por exemplo, as tres mostras (0, 0, 14, 14), (0, 6, 8, 14) e (6, 6, 8, 8) cada unha teñen unha media de 7. Os seus desvíos estándar son 7, 5 e 1, respectivamente. A terceira mostra ten un desvío moito menor que as outras dúas porque os seus valores están máis próximas a 7.

O desvío estándar pode ser interpretado como unha medida de incerteza. O desvío estándar dun grupo repetido de medidas dá a precisión destas. Cando se vai determinar se un grupo de medidas está de acordo co modelo teórico, o desvío estándar desas medidas é de vital importancia: se a media das medidas está demasiado afastada da predición (coa distancia medida en desvíos estándar), entón considérase que as medidas contradín a teoría. Isto é de esperarse xa que as medicións caen fóra do rango de valores dos cales sería razoable esperar que ocorresen se o modelo teórico fose correcto.

Formulación[editar | editar a fonte]

O desvío estándar (DS/DE) é unha medida de dispersión usada en estatística que indica canto tenden a afastarse os valores puntuais da media nunha distribución. De feito, especificamente o desvío estándar é "a media da distancia de cada punto respecto do valor medio". Adóitase representar por unha S ou coa letra sigma, . Esta medida é máis estable que o percorrido e toma en consideración o valor de cada dato.

É posible calcular o desvío estándar como a raíz cadrada da integral

onde

  • O DS é a raíz cadrada da varianza da distribución

Así a varianza é a media dos cadrados das diferencias entre cada valor da variable e a media aritmética da distribución.

Aínda que esta fórmula é correcta, na práctica interesa realizar inferencias poboacionais, polo que no denominador en vez de n, úsase n-1 (Corrección de Bessel)

Tamén temos outra función máis sinxela de realizar e con menos risco de ter equivocacións:

Exemplo[editar | editar a fonte]

Aquí móstrase como calcular o desvío estándar de un conxunto de datos. Os datos representan a idade dos membros de un grupo de nenos. { 5, 6, 8, 9 }

1. Calcular a media .

.

Neste caso, N = 4 porque hai catro datos:

      Substituíndo N por 4
  Esta é a media.


2. Calcular o desvío estándar

      Substituíndo N por 4
      Substituíndo por 7
  Este é o desvío estándar.

Notas[editar | editar a fonte]

  1. 1,0 1,1 Masa Vázquez, Xosé M.; Fortes López, Belén (1995). Vocabulario de Matemáticas. Servizo de Normalización Lingüística da Universidade de Santiago de Compostela. ISBN 84-8121-369-1. 

Véxase tamén[editar | editar a fonte]

Outros artigos[editar | editar a fonte]