Tamaño muestral

Calculadora de tamaño muestral para correlación de Pearson

Calcula cuántos pares de observaciones necesitas para detectar una correlación mínima significativa.

Calculadora

Introduce la correlación mínima a detectar, el alfa, la potencia y el tipo de contraste.

Resultado pendiente…

Explicación breve

Este cálculo determina cuántos pares de observaciones (n) se necesitan para detectar una correlación poblacional \(\rho\) diferente de cero con una potencia y un nivel de significación dados. La lógica es diferente a la de las calculadoras de medias o proporciones: aquí se utiliza la transformación z de Fisher, que estabiliza la varianza de \(\hat{\rho}\).

El estimador muestral \(\hat{\rho}\) (correlación de Pearson) tiene una distribución sesgada y asimétrica cuando \(\rho \neq 0\), con varianza que depende del propio \(\rho\). La transformación \(z = \operatorname{arctanh}(\hat{\rho})\) convierte esta distribución en aproximadamente normal con varianza \(1/(n-3)\), independiente de \(\rho\). Esto permite derivar n de forma directa a partir del cociente señal-ruido.

Fórmula de tamaño muestral

Sea \(z_\rho = \operatorname{arctanh}(\rho) = \frac{1}{2}\ln\!\left(\frac{1+\rho}{1-\rho}\right)\). Entonces:

\( n = \left\lceil \frac{(Z_{\alpha/2} + Z_\beta)^2}{z_\rho^2} \right\rceil + 3 \)

donde \(Z_{\alpha/2}\) es el cuantil normal para contraste bilateral (o \(Z_\alpha\) para unilateral) y \(Z_\beta = \Phi^{-1}(1-\beta)\).

  • ρ: correlación mínima de interés (en valor absoluto). El signo no importa para el tamaño muestral.
  • zρ: la transformación arctanh actúa como el "efecto estandarizado"; correlaciones pequeñas producen zρ pequeños y n grandes.
  • +3: corrección estándar derivada de la distribución exacta de \(\hat{\rho}\); mejora la aproximación para n pequeños.
  • Referencia (Cohen, 1988): ρ = 0,10 (pequeña), 0,30 (moderada), 0,50 (grande).

Supuestos del modelo

  • Normalidad bivariada: la fórmula asume que (X, Y) sigue una distribución normal bivariada. Desviaciones severas afectan la distribución de \(\hat{\rho}\).
  • Independencia: cada par (xi, yi) es independiente de los demás.
  • Relación lineal: la correlación de Pearson mide únicamente asociación lineal; una relación curvilínea fuerte con ρ ≈ 0 no sería detectada.
  • Ausencia de valores atípicos influyentes: los outliers pueden distorsionar gravemente \(\hat{\rho}\); en muestras pequeñas es especialmente relevante.

Configuración rápida

  • ρ desconocido: usa ρ = 0,30 como referencia conservadora de efecto moderado.
  • Contraste bilateral: usa cuando no tienes hipótesis direccional previa.
  • Contraste unilateral: solo si tienes razones sólidas para esperar una correlación positiva (o negativa) — reduce n pero exige justificación a priori.
  • Potencia: 0,80 es el mínimo habitual; 0,90 para estudios confirmatorios o validación psicométrica.

Ejemplo sencillo

Quieres detectar una correlación de al menos ρ = 0,30 con α = 0,05 bilateral y potencia 0,80. La transformación da zρ = arctanh(0,30) ≈ 0,3095. Necesitas aproximadamente 84 pares de observaciones.

Usos frecuentes

  • Validación de escalas psicométricas y cuestionarios (correlación ítem-total, fiabilidad test-retest).
  • Estudios de asociación entre dos variables continuas (biomarcadores, escalas clínicas, parámetros fisiológicos).
  • Análisis de concordancia inter-observador mediante correlación de Pearson o intraclase.
  • Estudios de validación de métodos de medición (p. ej. comparación de dos técnicas de laboratorio).

Referencias externas

¿Qué calcula esta herramienta?

Esta calculadora estima el número mínimo de pares de observaciones para detectar una correlación de Pearson de magnitud ρ con el nivel de significación y la potencia indicados.

Fórmula utilizada

Se aplica la transformación z de Fisher (arctanh) para obtener una estadística con varianza aproximadamente 1/(n-3), lo que permite derivar directamente n.

Ejemplo de uso

Introduce ρ = 0,30, α = 0,05 bilateral y potencia = 0,80, y pulsa Calcular. Si aumentas la potencia a 0,90 obtendrás una muestra mayor.

Cómo interpretar el resultado

El n calculado es el número de pares (individuos con las dos medidas). Si la correlación real es mayor de la esperada, el contraste tendrá más potencia de la planificada.

Preguntas frecuentes

  • ¿Qué es la transformación z de Fisher? z = arctanh(ρ) = ½·ln((1+ρ)/(1−ρ)); convierte la distribución sesgada de r̂ en aproximadamente normal con varianza 1/(n−3), lo que permite aplicar la aproximación normal para derivar n directamente.
  • ¿Correlación negativa? El módulo |ρ| es lo que determina el tamaño muestral; la dirección (positiva o negativa) no afecta a n, aunque sí al tipo de contraste (usa unilateral si tienes una hipótesis direccional).
  • ¿Qué diferencia hay entre bilateral y unilateral? Bilateral (H₁: ρ ≠ 0) usa Z_{α/2} y es apropiado cuando no tienes hipótesis previa sobre el signo. Unilateral (H₁: ρ > 0) usa Z_α y da n ligeramente menor, pero exige justificación a priori.
  • ¿Funciona para correlación de Spearman o tau? La fórmula de Fisher es estricta para la correlación de Pearson con normalidad bivariada. Para Spearman puede usarse como aproximación, aunque con menor precisión.
  • ¿El tamaño muestral es exacto? Es una aproximación; funciona bien para n > 20. Para n muy pequeños, métodos exactos (simulación o tablas de potencia) son más precisos.