Descripción

El contraste chi-cuadrado de bondad de ajuste permite evaluar si la distribución empírica de una variable categórica es compatible con una distribución teórica previamente especificada. La pregunta que responde es: ¿los recuentos observados en cada categoría son compatibles con las probabilidades que postula el modelo, o hay evidencia de que la distribución real difiere?

La idea central es comparar las frecuencias observadas con las frecuencias esperadas que se obtendrían si la hipótesis nula fuera cierta. Si las discrepancias son demasiado grandes para atribuirlas al azar de muestreo, se rechaza el modelo teórico propuesto.

Por ejemplo, un dado equilibrado debería producir cada cara con probabilidad 1/6. Tras 120 lanzamientos, se compara si los recuentos observados son compatibles con esas probabilidades. Otro uso habitual es verificar si la proporción de defectos por tipo en una línea de producción coincide con el patrón histórico esperado.

El estadístico de contraste agrega las discrepancias ponderadas de todas las categorías y sigue una distribución chi-cuadrado bajo la hipótesis nula. Los grados de libertad son \(k - 1\), donde \(k\) es el número de categorías, menos el número de parámetros adicionales estimados con la muestra.

Hipótesis y estadístico

\(H_0\): la distribución observada coincide con la teórica

\(H_1\): la distribución observada no coincide con la teórica

\(\chi^2 = \sum_{i=1}^{k}\frac{(O_i - E_i)^2}{E_i}\), con \(E_i = n \cdot p_i\)

Calculadora

Introduce las frecuencias observadas y las probabilidades teóricas separadas por comas. Si no indicas probabilidades, se asume distribución uniforme.

Frecuencias observadas

Probabilidades teóricas (opcional)

Nivel de significación (α)

Resultado pendiente…

Frecuencias esperadas pendientes…

Contraste rápido

El estadístico chi-cuadrado suma, para cada categoría, el cuadrado de la diferencia entre frecuencia observada y esperada, dividido entre la frecuencia esperada. Bajo la hipótesis nula de que los datos siguen la distribución teórica, este estadístico sigue aproximadamente una distribución \(\chi^2\) con \(k - 1\) grados de libertad:

\(\chi^2 = \sum_{i=1}^{k} \frac{(O_i - E_i)^2}{E_i} \sim \chi^2_{k-1}\)

Las frecuencias esperadas se calculan a partir del tamaño muestral \(n\) y las probabilidades teóricas \(p_i\):

\(E_i = n \cdot p_i\)

donde \(n = \sum_{i=1}^{k} O_i\) es el total de observaciones. Si las probabilidades teóricas son iguales para todas las categorías (distribución uniforme), \(E_i = n / k\) para todo \(i\).

Para que la aproximación chi-cuadrado sea fiable, conviene que todas las frecuencias esperadas sean mayores o iguales que 5. Si alguna categoría tiene frecuencias esperadas muy bajas, considera agrupar categorías antes de aplicar el contraste.

¿Qué calcula esta herramienta?

Esta calculadora de chi-cuadrado de bondad de ajuste toma las frecuencias observadas en cada categoría y las probabilidades teóricas del modelo a contrastar, calcula las frecuencias esperadas, obtiene el estadístico \(\chi^2\), los grados de libertad y el p-valor, y emite una decisión automática al nivel de significación indicado.

La herramienta también muestra la tabla de frecuencias esperadas y un gráfico con la distribución de referencia, la zona de rechazo y la posición del estadístico observado, lo que facilita la interpretación visual del resultado.

Fórmula utilizada

Las frecuencias esperadas bajo la hipótesis nula se calculan para cada categoría \(i\) como:

\(E_i = n \cdot p_i\)

El estadístico de contraste es:

\(\chi^2 = \sum_{i=1}^{k} \frac{(O_i - E_i)^2}{E_i}\)

Bajo \(H_0\), este estadístico sigue una distribución \(\chi^2\) con \(k - 1\) grados de libertad (menos el número de parámetros estimados con la muestra, si los hay). El p-valor es la probabilidad de obtener un estadístico tan grande o mayor si la hipótesis nula fuera cierta:

\(p = P\!\left(\chi^2_{k-1} \geq \chi^2_{\text{obs}}\right)\)

Ejemplo de uso

Supón que lanzas un dado 120 veces y obtienes los siguientes recuentos por cara: 25, 18, 22, 20, 17 y 18. Quieres saber si el dado es equilibrado. Las probabilidades teóricas son 1/6 para cada cara, lo que implica una frecuencia esperada de 20 para cada una. Introduces los recuentos, dejas las probabilidades en blanco (distribución uniforme), fijas α = 0,05 y pulsas calcular. Si el p-valor supera 0,05, los datos son compatibles con un dado equilibrado.

En genética mendeliana, epidemiología y control de calidad es habitual contrastar si la proporción observada de cada categoría se ajusta a un patrón teórico: ratios de segregación genética, distribución esperada de grupos sanguíneos o proporción de defectos por tipo según histórico de producción.

Cómo interpretar el resultado

Si el p-valor es menor que \(\alpha\), se rechaza \(H_0\) y se concluye que hay evidencia estadística de que la distribución real difiere de la teórica especificada. Si el p-valor es mayor o igual que \(\alpha\), no hay evidencia suficiente para rechazar el modelo con ese nivel de significación.

Un resultado significativo indica que el modelo no ajusta bien globalmente, pero no identifica directamente cuáles categorías son responsables. Para localizarlo, revisa los residuos estandarizados \((O_i - E_i)/\sqrt{E_i}\): valores por encima de 2 en valor absoluto señalan las categorías que más contribuyen a la discrepancia.

También es importante verificar que todas las frecuencias esperadas sean ≥ 5 antes de interpretar el p-valor. La tabla de frecuencias esperadas que muestra la herramienta facilita esta comprobación.

Preguntas frecuentes

¿Cuándo se usa el contraste chi-cuadrado de bondad de ajuste? Cuando se quiere saber si los recuentos observados en categorías mutuamente excluyentes son compatibles con una distribución teórica previamente especificada.
¿Cuántos grados de libertad tiene el estadístico? Los grados de libertad son \(k - 1\), donde \(k\) es el número de categorías. Si se han estimado parámetros adicionales del modelo con la propia muestra, se resta uno por cada parámetro estimado.
¿Qué condición deben cumplir las frecuencias esperadas? La aproximación es adecuada cuando todas las frecuencias esperadas son ≥ 5. Si alguna es inferior, considera agrupar categorías poco frecuentes.
¿Qué diferencia hay con el chi-cuadrado de independencia? El de bondad de ajuste contrasta si una variable sigue una distribución teórica concreta. El de independencia contrasta si dos variables están asociadas entre sí, a partir de una tabla de contingencia.
¿Las probabilidades teóricas deben sumar exactamente 1? Sí. La herramienta verifica que las probabilidades introducidas sumen 1 (con tolerancia numérica) y avisa si no se cumple esa condición.
¿Cómo afecta el tamaño muestral al resultado? Con muestras muy grandes, el contraste puede detectar desviaciones muy pequeñas respecto al modelo teórico que no son relevantes en la práctica. En esos casos conviene complementar el p-valor con una medida de tamaño del efecto.