Test A/B

Test Z de conversión — A/B testing

Contrasta si las tasas de conversión de dos variantes difieren significativamente, con corrección por continuidad e intervalo de confianza para la diferencia.

Hipótesis y estadístico

Se contrasta \(H_0: p_A = p_B\) frente a la alternativa seleccionada. Bajo \(H_0\), ambos grupos comparten la misma proporción poblacional, por lo que se usa la proporción combinada \(\hat{p}\) para estimar el error estándar.

\( z = \dfrac{\hat{p}_B - \hat{p}_A}{\sqrt{\hat{p}(1-\hat{p})\!\left(\tfrac{1}{n_A}+\tfrac{1}{n_B}\right)}}, \quad \hat{p}=\dfrac{x_A+x_B}{n_A+n_B} \)

Corrección por continuidad de Yates

Con muestras pequeñas, la distribución discreta del estadístico se aproxima mejor a la normal restando la corrección:

\( z_{\text{corr}} = \dfrac{\left|\hat{p}_B - \hat{p}_A\right| - \tfrac{1}{2}\!\left(\tfrac{1}{n_A}+\tfrac{1}{n_B}\right)}{\sqrt{\hat{p}(1-\hat{p})\!\left(\tfrac{1}{n_A}+\tfrac{1}{n_B}\right)}} \)

Intervalo de confianza para la diferencia

El IC para \(\Delta = p_B - p_A\) se construye con el error estándar Wald (sin pooling), más conservador que el del contraste:

\( \Delta \pm z_{\alpha/2}\sqrt{\dfrac{\hat{p}_A(1-\hat{p}_A)}{n_A} + \dfrac{\hat{p}_B(1-\hat{p}_B)}{n_B}} \)

Calculadora

Introduce los éxitos y tamaños de cada grupo para obtener el p-valor, el estadístico z y el intervalo de confianza para la diferencia.

Resultado pendiente…

¿Qué calcula esta herramienta?

Esta calculadora aplica el test Z bilateral o unilateral para la diferencia de dos proporciones en el contexto de un experimento A/B. Devuelve el estadístico z, el p-valor, el intervalo de confianza para la diferencia de tasas de conversión y la decisión estadística según el nivel α elegido.

Cuándo usar la corrección de Yates

La corrección por continuidad mejora la aproximación a la distribución normal cuando los tamaños muestrales son pequeños (generalmente n < 50 por grupo) o cuando la proporción está cerca de 0 o 1. Con muestras grandes produce resultados casi idénticos al test sin corrección y resulta ligeramente más conservadora.

Cómo interpretar el resultado

Si el p-valor es menor que α (habitualmente 0.05), la diferencia observada es estadísticamente significativa: existe evidencia para concluir que las tasas de conversión difieren. El intervalo de confianza para Δ = p_B − p_A indica el rango plausible de la diferencia real; si no incluye el cero, respalda el rechazo de H₀.

Preguntas frecuentes

  • ¿Qué diferencia hay respecto al contraste general de dos proporciones? Ninguna matemática: el test Z es el mismo. Esta calculadora añade el intervalo de confianza para la diferencia, la corrección de Yates y métricas específicas de A/B (lift relativo).
  • ¿Es válido con proporciones muy bajas? Sí, pero requiere tamaños muestrales mayores para que la aproximación normal sea fiable. Como regla práctica, necesitas n·p ≥ 5 y n·(1−p) ≥ 5 en cada grupo.
  • ¿Debo usar contraste bilateral o unilateral? Si antes de ver los datos no sabes en qué dirección podría ir el efecto, usa bilateral. El unilateral tiene más potencia, pero solo es legítimo cuando la dirección se fijó a priori.
  • ¿El p-valor = 0.04 significa que B es mejor al 96%? No. El p-valor mide la probabilidad de observar un estadístico tan extremo o más si H₀ fuese cierta, no la probabilidad de que B sea mejor.