¿Qué es una distribución de probabilidad?
Una distribución de probabilidad describe cómo se reparte la probabilidad entre los posibles valores de una variable aleatoria. Gracias a una distribución podemos cuantificar qué resultados son más probables, cuáles son raros y cómo se comporta un fenómeno en promedio y en su variabilidad.
Función de densidad (PDF), función de masa (PMF) y función de distribución acumulada (CDF)
En variables continuas se usa la función de densidad (PDF), que no da probabilidad puntual directa, sino densidad de probabilidad en torno a un intervalo. En variables discretas se usa la función de masa (PMF), que sí asigna probabilidad a cada valor concreto.
La función de distribución acumulada (CDF) se aplica a ambos casos y representa la probabilidad acumulada hasta un valor x: \(P(X \le x)\). Es clave para calcular colas, intervalos y percentiles.
Diferencia entre distribuciones continuas y discretas
Distribuciones discretas: modelan conteos enteros (por ejemplo, número de éxitos o de eventos).
Distribuciones continuas: modelan magnitudes medibles en una escala real (por ejemplo, tiempos, longitudes o errores de medida).
Todas las distribuciones disponibles
Breve explicación de cada distribución
- Normal: continua, simétrica y en forma de campana; base de muchos modelos por el teorema central del límite.
- Binomial: discreta; número de éxitos en n ensayos independientes con probabilidad p constante.
- Poisson: discreta; conteo de eventos en intervalos cuando ocurren con tasa media constante.
- t de Student: continua; similar a la normal pero con colas más pesadas, útil con muestras pequeñas y varianza desconocida.
- Chi-cuadrado: continua y no negativa; muy usada en inferencia sobre varianzas y pruebas de ajuste/independencia.
- F de Fisher: continua y no negativa; cociente de varianzas, central en ANOVA y comparación de modelos.
- Exponencial: continua; modela tiempos de espera entre eventos de un proceso de Poisson.
- Uniforme: continua; todos los valores dentro de un intervalo tienen la misma densidad.
- Gamma: continua y positiva; generaliza a la exponencial y modela tiempos de espera acumulados.
- Beta: continua en [0,1]; muy útil para proporciones y probabilidades.
- Lognormal: continua y positiva; aparece cuando el logaritmo de la variable sigue una normal.
- Weibull: continua y positiva; frecuente en fiabilidad y análisis de supervivencia/vida útil.
- Binomial negativa: discreta; número de fallos hasta observar cierto número de éxitos.
- Geométrica: discreta; número de ensayos hasta el primer éxito.
- Hipergeométrica: discreta; muestreo sin reemplazo desde población finita.
- Bernoulli: discreta binaria; un solo ensayo con éxito (1) o fracaso (0).