Potencia (estatística)

A potencia dunha proba estatística é a probabilidade de que a hipótese nula sexa rexeitada cando a hipótese alternativa é verdadeira (é dicir, a probabilidade de non cometer un erro do tipo II. A potencia é en xeral unha función das distribucións posibles, decote determinada por un parámetro, baixo a hipótese alternativa. A medida que aumenta a potencia, as posibilidades de que ocorra un erro do tipo II diminúen. A potencia é igual a 1 – β.

{\mbox{potencia estatística}}=\mathbb {P} {\big (}{\mbox{rexeitar a hipótese nula }}{\big |}{\mbox{a hipótese nula é falsa}}{\big )}

A análise da potencia pode empregarse para calcular o tamaño mínimo da mostra necesario para que se poida detectar de xeito razoable o tamaño do efecto mínimo que é probable que se detecte nun estudo usando un tamaño de mostra dado. Ademais, o concepto de alimentación emprégase para facer comparacións entre procedementos diferentes de análises estatísticos, por exemplo entre un paramétrico e unha proba non paramétrica da mesma hipótese.

Tamén existe o concepto dunha función de potencia dunha proba, que é a probabilidade de rexeitar a hipótese nula cando é verdadeira.^[1]

Antecedentes

Os contrastes de hipóteses empregan datos de mostras para avaliar ou facer inferencias sobre unha poboación estatística. Na configuración concreta dunha comparación entre dúas mostras o obxectivo é avaliar se os valores medios dalgún atributo obtido para os individuos en dúas subpoboacións difiren. Por exemplo, para probar a hipótese nula de que as medias das puntuacións de homes e mulleres nunha proba non difiren, créanse as mostras dos homes e das mulleres, aplícase a proba e compáranse a puntuación media dun grupo coa do outro cunha proba estatística. A potencia da proba é a probabilidade de que o test atope unha diferenza estatisticamente significativa entre homes e mulleres, en función do tamaño da diferenza verdadeira entre as dúas poboacións.

Factores que inflúen na potencia

A potencia estatística pode depender dun gran número de factores. Algúns destes factores poden ser particulares a unha situación de proba específica, pero como mínimo a potencia depende case sempre dos seguintes tres factores:

O criterio de significación estatística utilizado na proba.
A magnitude do efecto de interese na poboación.
O tamaño da mostra usado para detectar o efecto.

O criterio de relevancia é unha declaración do improbable que debe de ser un resultado positivo, se for certa a hipótese nula de non efecto, para que a hipotése nula sexa rexeitada. Os criterios máis empregados son as probabilidades de 0,05 (5%, un entre vinte), 0,01 (1%, un entre cen) e 0,001 (0,1%, un entre 1000). Unha forma sinxela de aumentar a potencia dunha proba é realizar un test menos conservador utilizando un criterio de significación maior, por exemplo 0,10 no lugar de 0,05. Isto reduce o risco dun erro do tipo II, pero tamén aumenta o risco dun erro do tipo I.

A magnitude do efecto de interese na poboación pódese cuantificar en termos dun tamaño do efecto, onde hai maior potencia para detectar os efectos máis grandes. Un tamaño do efecto pode ser unha estimación directa da cantidade de interese ou pode ser unha medida estándar que tamén é responsable da variabilidade na poboación. Por exemplo, nunha análise comparativa dos resultados nunha poboación tratada e o control, a diferenza dos resultados significa que Y - X sería unha medida directa da magnitude do efecto, mentres que (Y - X) / σ (onde σ é o desvío estándar común dos resultados nos grupos tratados e no de control) sería un tamaño do efecto estandarizado. Se se constrúe apropiadamente, un tamaño de efecto estandarizado, xunto co tamaño da mostra, determina completamente a potencia. Un tamaño do efecto non estándar habitualmente non será suficiente para determinar a potencia, xa que non contén información sobre a variabilidade das medicións.

O tamaño da mostra determina a cantidade de erro de mostraxe inherente a un resultado da proba. En condicións iguais, os efectos son máis difíciles de detectar en mostras máis pequenas. O aumento do tamaño da mostra é habitualmente o xeito máis sinxelo de aumentar a potencia dunha proba.

A precisión coa que se miden os datos tamén inflúe na potencia estatística. Polo tanto a potencia acotío pode mellorarse mediante a redución do erro de medición dos datos. Un concepto relacionado é o de mellorar a "fiabilidade" da medida que se está a avaliar (como na fiabilidade psicométrica ).

O deseño dun experimento moitas veces inflúe na potencia. Por exemplo, nunha situación de proba de dúas mostras cun tamaño total da mostra dado n o óptimo é ter o mesmo número de observacións das dúas poboacións que se comparan (sempre que as variacións nas dúas poboacións sexa a mesma). Na análise da regresión e na análise da varianza hai unha extensa teoría e estratexias prácticas para a mellora da enerxía baseada no establecemento de forma óptima dos valores das variables independentes no modelo.

Interpretación

A pesar de non existiren normas formais para a potencia (ás veces referida como π), a maioría dos investigadores avalían a potencia das súas probas con π = 0,80 coma un estándar para a adecuación. Este convenio implica un intercambio de catro a un entre o β-risco e o α-risco (onde β é a probabilidade dun erro do tipo II e α é a probabilidade dun erro de tipo I, sendo o,2 e 0,05 valores convencionais para β e α). Porén, haberá ocasións nas que esta ponderación é inapropiada. Por exemplo, na Medicina, as probas son decote deseñadas de tal xeito que non se producirán erros de tipo II. Mais isto dá lugar a que exista o risco de obter un erro de tipo I (falso positivo). A razón é que é preferible dicirlle a un paciente san "é posible que encontrásemos algo, polo que imos facer máis probas", que dicirlle a un paciente enfermo "todo está ben".^[2]

A análise da potencia é apropiada cando a preocupación é co rexeitamento correcto ou non dunha hipótese nula. En moitos contextos, a cuestión non é tanto sobre a determinación de se houber ou non unha diferenza, senón con conseguir unha estimación máis axustada do tamaño do efecto de poboación. Por exemplo, se nunha poboación esperabamos unha correlación entre a intelixencia e o desempeño laboral de preto de 0,50, un tamaño de mostra de vinte individuos dará unha enerxía de aproximadamente 80% (α = 0,05, dúas colas) para rexeitar a hipótese nula de correlación cero. Non obstante, se se fixese este estudo é probable que estivésemos máis interesados en saber se a correlación é 0,30, 0,60 ou 0,50. Neste contexto, precisariamos dunha mostra moito maior co fin de reducir o intervalo de confianza da nosa estimación a un rango aceptable para os nosos propósitos. Técnicas semellantes ás empregadas nunha análise da potencia tradicional poden ser utilizadas para determinar o tamaño da mostra necesario para que a lonxitude dun intervalo de confianza sexa inferior a un valor dado.

Notas

↑ http://www.encyclopediaofmath.org/index.php/Power_function_of_a_test
↑ Ellis, Paul D. (2010). Cambridge University Press, ed. The Essential Guide to Effect Sizes: An Introduction to Statistical Power, Meta-Analysis and the Interpretation of Research Results. Reino Unido.

[1] ttp://www.encyclopediaofmath.org/index.php/Power_function_of_a_test

[2] Ellis, Paul D. (2010). Cambridge University Press, ed. The Essential Guide to Effect Sizes: An Introduction to Statistical Power, Meta-Analysis and the Interpretation of Research Results. Reino Unido.

[1]

[2]