Una prueba de significación, también conocida como prueba de hipótesis estadística, es un método de inferencia estadística en el que los datos observados se comparan con una afirmación (denominada hipótesis) con el fin de evaluar la veracidad de la afirmación. Por ejemplo, uno podría preguntarse si la edad afecta la cantidad de manzanas que una persona puede comer y puede usar una prueba de significación para determinar si hay alguna evidencia que sugiera que sí.
Generalmente, el proceso de prueba de hipótesis estadísticas implica los siguientes pasos:
- Indique la hipótesis nula.
- Exprese la hipótesis alternativa.
- Seleccione la estadística de prueba adecuada y seleccione un nivel de significancia.
- Calcule el valor observado de la estadística de prueba y su valor p correspondiente.
- Rechace la hipótesis nula a favor de la hipótesis alternativa, o no rechace la hipótesis nula.
La hipótesis nula
La hipótesis nula, H 0 , es la afirmación que se está probando en una prueba de hipótesis estadística. Por lo general, es una declaración de que no hay diferencia entre las poblaciones que se están estudiando, o que no hay evidencia para respaldar una afirmación. Por ejemplo, «la edad no afecta la cantidad de manzanas que una persona puede comer».
Una prueba de significancia está diseñada para probar la evidencia contra la hipótesis nula. Esto se debe a que es más fácil probar que una afirmación es falsa que probar que es verdadera; demostrar que la afirmación es falsa en un caso es suficiente, mientras que demostrar que es verdadera requiere que la afirmación sea verdadera en todos los casos.
La hipótesis alternativa
La hipótesis alternativa es lo opuesto a la hipótesis nula en que es una afirmación de que hay alguna diferencia entre las poblaciones estudiadas. Por ejemplo, «las personas más jóvenes pueden comer más manzanas que las personas mayores».
La hipótesis alternativa suele ser la hipótesis que los investigadores intentan probar. Una prueba de significancia está destinada a determinar si hay suficiente evidencia para rechazar la hipótesis nula a favor de la hipótesis alternativa. Tenga en cuenta que los resultados de una prueba de significancia deben ser rechazar la hipótesis nula a favor de la hipótesis alternativa o no rechazar la hipótesis nula. El resultado no debería ser rechazar la hipótesis alternativa o aceptar la hipótesis alternativa.
Estadísticas de prueba y nivel de significancia
Una estadística de prueba es una estadística que se calcula como parte de una prueba de hipótesis que compara la distribución de los datos observados con la distribución esperada, según la hipótesis nula. Entre los ejemplos de estadísticas de prueba se incluyen la puntuación Z, la estadística T, la estadística F y la estadística de Chi-cuadrado. La estadística de prueba utilizada depende de la prueba de significación utilizada, que depende del tipo de datos recopilados y del tipo de relación que se va a probar.
En muchos casos, el nivel de significancia elegido es 0.05, aunque también se usa 0.01. Un nivel de significancia de 0.05 indica que existe un 5% de probabilidad de rechazar la hipótesis nula cuando la hipótesis nula es realmente cierta. Por lo tanto, un nivel de significancia seleccionado más pequeño requerirá más evidencia si la hipótesis nula se rechaza a favor de la hipótesis alternativa.
valor p
Una vez calculada la estadística de prueba, el valor p se puede determinar en función del resultado de la estadística de prueba. El valor p indica la probabilidad de obtener resultados de prueba que sean al menos tan extremos como los resultados observados, bajo el supuesto de que la hipótesis nula es correcta. Nos dice qué tan probable es obtener un resultado basado únicamente en el azar. Cuanto menor sea el valor p, menos probable es que se produzca un resultado por pura casualidad, mientras que un valor p mayor lo hace más probable. Por ejemplo, un valor p de 0.01 significa que hay un 1% de probabilidad de que un resultado ocurra únicamente por casualidad, dado que la hipótesis nula es verdadera; un valor p de 0,90 significa que hay un 90% de probabilidad.
Un valor p se ve afectado significativamente por el tamaño de la muestra . Cuanto mayor sea el tamaño de la muestra, menor será el valor p, incluso si la diferencia entre poblaciones puede no ser significativa. Por otro lado, si el tamaño de una muestra es demasiado pequeño, es posible que no se detecte una diferencia significativa.
El último paso en una prueba de significancia es determinar si el valor p proporciona evidencia de que la hipótesis nula debe rechazarse a favor de la hipótesis alternativa. Esto se basa en el nivel de significancia seleccionado. Si el valor p es menor o igual al nivel de significancia seleccionado, la hipótesis nula se rechaza a favor de la hipótesis alternativa y el resultado se considera estadísticamente significativo. Si el valor p es mayor que el nivel de significancia seleccionado, la hipótesis nula no se rechaza y el resultado no se considera estadísticamente significativo.