Contrastes de hipótesis

Calculadora de Shapiro–Wilk (normalidad)

Contrasta si una muestra es compatible con una distribución normal.

Descripción

El test de Shapiro–Wilk es una prueba estadística diseñada para evaluar si una muestra de datos puede considerarse proveniente de una distribución normal. Es uno de los tests de normalidad más potentes y recomendados para tamaños muestrales pequeños y moderados.

El test compara:

  • Los datos ordenados de tu muestra
  • l os valores esperados de una muestra normal ordenada
Si tus datos “se alinean” bien con lo que se esperaría de una muestra normal, el estadístico será grande (cercano a 1). Si se desvían de esa alineación, el estadístico será pequeño.

La hipótesis nula plantea que los datos siguen una normal; la alternativa plantea que no siguen una normal. El estadístico del test se denota por \(W\), y toma valores entre 0 y 1: cuanto más cerca de 1, mayor compatibilidad con normalidad.

El estadístico de Shapiro–Wilk se construye combinando los datos ordenados \(x_{(i)}\) con coeficientes \(a_i\) que dependen de \(n\):

\(W = \dfrac{\left(\sum_{i=1}^{m} a_i(x_{(n+1-i)}-x_{(i)})\right)^2}{\sum_{i=1}^{n}(x_i-\bar{x})^2}\) donde:

  • \(x_{(i)}\) son los datos ordenados,
  • \(a_i\) son coeficientes calculados a partir de los cuantiles normales teóricos,
  • el denominador es la variabilidad total de la muestra.

Dado que el estadístico \(W\) no posee una distribución de probabilidad cerrada bajo la hipótesis de normalidad, su distribución se aproxima mediante simulación de Monte Carlo. Para ello se generan muchas muestras normales \(N(0,1)\), ya que el valor de \(W\) es invariante a cambios de escala y traslación: solo importa el orden de los datos, la forma de la distribución y la relación lineal entre los cuantiles normales teóricos y los datos observados. En cada muestra simulada de tamaño \(n\) se calcula el estadístico \(W\), y con todos esos valores se construye una distribución empírica. El valor observado \(W_{\text{obs}}\) se compara con esta distribución simulada para obtener el p‑valor del test.

La decisión formal se realiza con el p-valor: si es menor que el nivel de significación \(\alpha\), se rechaza la normalidad.

Hipótesis y estadístico

\(H_0\): la muestra procede de una distribución normal

\(H_1\): la muestra no procede de una distribución normal

\(W = \dfrac{\left(\sum_{i=1}^{m} a_i(x_{(n+1-i)}-x_{(i)})\right)^2}{\sum_{i=1}^{n}(x_i-\bar{x})^2}\)

Calculadora

Introduce los datos muestrales y simula la distribución nula de \(W\) por Monte Carlo para obtener un p-valor empírico.

Resultado pendiente…
Notas de interpretación pendientes…

Cómo leer el gráfico (paso a paso): 1) La simulación Monte Carlo genera muchas muestras normales bajo \(H_0\) del mismo tamaño que tu muestra y calcula un \(W\) en cada una. 2) Las barras azules cuentan cuántas simulaciones cayeron en cada rango de \(W\): por eso su eje Y es frecuencia y su eje X es valor de \(W\). 3) El marcador rojo señala tu \(W\) observado y el verde el \(W\) crítico para \(\alpha\). Solo importa su posición horizontal (X); su altura vertical se fija artificialmente para que se vean sobre las barras.

Contraste rápido

En Shapiro–Wilk, el p-valor es la base de la decisión estadística. El estadístico \(W\) resume cuánto se desvían los datos ordenados respecto al patrón esperado bajo normalidad.

\(\text{Si } p < \alpha\Rightarrow\) rechazar \(H_0\)

\(\text{Si } p \ge \alpha\Rightarrow\) no rechazar \(H_0\)

Un resultado no significativo no demuestra normalidad perfecta: indica que, con la evidencia disponible en esa muestra, no se detectan desviaciones claras. Conviene complementar con gráfico Q–Q e histograma.

¿Qué calcula esta herramienta?

Esta calculadora del test de Shapiro–Wilk toma \(W\), el tamaño muestral \(n\), el p-valor y el nivel \(\alpha\), y devuelve una decisión automática sobre la hipótesis de normalidad.

También muestra un gráfico con barras de p-valor y \(\alpha\), para facilitar una lectura visual rápida del criterio de rechazo.

Fórmula utilizada

El estadístico de Shapiro–Wilk se construye combinando los datos ordenados \(x_{(i)}\) con coeficientes \(a_i\) que dependen de \(n\):

\(W = \dfrac{\left(\sum_{i=1}^{m} a_i(x_{(n+1-i)}-x_{(i)})\right)^2}{\sum_{i=1}^{n}(x_i-\bar{x})^2}\)

La decisión práctica se obtiene comparando p-valor con \(\alpha\):

\(p < \alpha \Rightarrow\) evidencia contra normalidad

Ejemplo de uso

Imagina una muestra de \(n=30\) observaciones con resultado \(W=0.94\) y p-valor 0.028. Con \(\alpha = 0.05\), se cumple \(0.028 < 0.05\), por lo que se rechaza \(H_0\): hay evidencia de desviación de la normalidad.

Cómo interpretar el resultado

Si el p-valor es menor que \(\alpha\), la muestra muestra una desviación estadísticamente significativa respecto a una normal. Si es mayor o igual, no hay evidencia suficiente para rechazar normalidad al nivel elegido.

En muestras grandes, desviaciones pequeñas pueden resultar significativas. Por eso es recomendable evaluar también relevancia práctica y diagnóstico gráfico.

Preguntas frecuentes

  • ¿Qué tamaños muestrales son habituales para Shapiro–Wilk? Se usa mucho en muestras pequeñas y medianas, aunque también puede aplicarse en tamaños mayores según software.
  • ¿Un p-valor alto demuestra normalidad? No. Solo indica que no hay evidencia suficiente para rechazar normalidad con esa muestra y ese nivel de significación.
  • ¿Debo usar solo el test? No. La práctica recomendada es combinar test formal con gráfico Q–Q e histograma.