El contraste de hipótesis (o prueba de hipótesis) es una herramienta fundamental en la inferencia estadística que nos permite tomar decisiones sobre una población basándonos en los datos de una muestra. En esencia, es un procedimiento para determinar si hay suficiente evidencia en nuestros datos para rechazar una afirmación inicial sobre una característica de la población.
1. ¿Qué es una Hipótesis Estadística?
En el contexto del contraste de hipótesis, una hipótesis estadística es una afirmación o conjetura sobre uno o más parámetros de una población. Siempre trabajaremos con un par de hipótesis que son mutuamente excluyentes:
- Hipótesis Nula (H0): Es la afirmación inicial que se asume como verdadera hasta que haya suficiente evidencia para lo contrario. Generalmente, representa el “statu quo” o la ausencia de efecto, diferencia o relación. Por ejemplo: “La media de altura de los hombres es de 175 cm” o “No hay diferencia en el rendimiento entre dos métodos de enseñanza”.
- Hipótesis Alternativa (H1 o Ha): Es la afirmación que queremos probar. Es lo que sospechamos que es cierto si la hipótesis nula resulta ser falsa. Puede ser unilateral (mayor que, menor que) o bilateral (diferente de). Por ejemplo: “La media de altura de los hombres es diferente de 175 cm” o “El método de enseñanza A es mejor que el método de enseñanza B”.
2. Los Pasos del Contraste de Hipótesis
El proceso de contraste de hipótesis generalmente sigue estos pasos:
Paso 1: Formular las Hipótesis
Definir claramente la hipótesis nula (H0) y la hipótesis alternativa (H1).
Paso 2: Elegir un Nivel de Significación (α)
El nivel de significación (α) es la probabilidad máxima de cometer un error de Tipo I (ver más abajo). Los valores comunes para α son 0.05 (5%), 0.01 (1%) o 0.10 (10%). Un α de 0.05 significa que estamos dispuestos a aceptar un 5% de probabilidad de rechazar la hipótesis nula cuando en realidad es verdadera.
Paso 3: Seleccionar la Prueba Estadística Adecuada
La elección de la prueba estadística (por ejemplo, prueba t, prueba Z, ANOVA, chi-cuadrado) depende del tipo de datos, el número de muestras, si los datos son paramétricos o no paramétricos, y el objetivo de la investigación.
Paso 4: Calcular el Estadístico de Prueba
Se calcula un estadístico de prueba a partir de los datos de la muestra. Este valor resume la evidencia de la muestra en relación con la hipótesis nula.
Paso 5: Tomar una Decisión
Hay dos métodos principales para tomar una decisión:
- Método del Valor p: El valor p es la probabilidad de obtener un estadístico de prueba tan extremo o más extremo que el observado, asumiendo que la hipótesis nula es verdadera.
- Si valor p ≤α: Rechazamos la hipótesis nula (H0). Hay suficiente evidencia para apoyar la hipótesis alternativa (H1).
- Si valor p >α: No rechazamos la hipótesis nula (H0). No hay suficiente evidencia para rechazar H0.
- Método de la Región Crítica: Se define una región crítica (o región de rechazo) en la distribución del estadístico de prueba. Si el valor del estadístico de prueba cae dentro de esta región, se rechaza la hipótesis nula. La región crítica se determina por el nivel de significación (α) y el tipo de hipótesis alternativa (unilateral o bilateral).
3. Tipos de Errores en el Contraste de Hipótesis
Al tomar una decisión, siempre existe la posibilidad de cometer un error:
- Error de Tipo I (α): Rechazar la hipótesis nula cuando en realidad es verdadera. También se conoce como “falso positivo”. La probabilidad de cometer este error es igual al nivel de significación que elegimos.
- Error de Tipo II (β): No rechazar la hipótesis nula cuando en realidad es falsa. También se conoce como “falso negativo”. La probabilidad de cometer este error se denota con β.
La relación entre α y β es inversa: reducir uno tiende a aumentar el otro. El poder estadístico de una prueba (1 – β) es la probabilidad de rechazar correctamente una hipótesis nula falsa.
4. Ejemplo Sencillo
Imaginemos que una fábrica de dulces afirma que sus paquetes de caramelos contienen, en promedio, 50 caramelos. Un inspector de calidad sospecha que la cantidad real es menor.
- Paso 1: Formular Hipótesis
- H0: μ=50 (La media de caramelos por paquete es 50)
- H1: μ<50 (La media de caramelos por paquete es menor que 50)
- Paso 2: Nivel de Significaión
- α=0.05
- Paso 3: Seleccionar Prueba
- Se toma una muestra de 30 paquetes y se calcula la media. Se podría usar una prueba t de una muestra (asumiendo que la desviación estándar de la población es desconocida).
- Paso 4: Calcular Estadístico de Prueba
- Supongamos que la media muestral es 48 caramelos y el cálculo del estadístico de prueba (valor t) es -2.5.
- Paso 5: Tomar Decisión
- Se calcula el valor p asociado a un t de -2.5 para una prueba unilateral. Si el valor p resultante es 0.01 (por ejemplo).
- Como 0.01 (valor p) ≤ 0.05 (α), rechazamos la hipótesis nula.
Conclusión: Hay suficiente evidencia estadística para concluir que la cantidad media de caramelos por paquete es menor de 50.