Distribución t de Student

Análisis interactivo de la distribución t de Student. Explora sus propiedades, fórmulas, aplicaciones y visualizaciones con controles dinámicos para una comprensión profunda de esta distribución fundamental en estadística inferencial.

Distribución t de Student

$T \sim t(\nu)$
Función de Densidad de Probabilidad (PDF)
$$f(t; \nu) = \frac{1}{\sqrt{\nu}B\left(\frac{1}{2}, \frac{\nu}{2}\right)} \left(1 + \frac{t^2}{\nu}\right)^{-\frac{\nu+1}{2}}$$
Donde $B$ es la función beta, que está relacionada con la función gamma mediante $B(a,b) = \frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}$.
Forma alternativa usando función Gamma
$$f(t; \nu) = \frac{\Gamma\left(\frac{\nu+1}{2}\right)}{\sqrt{\nu\pi}\,\Gamma\left(\frac{\nu}{2}\right)} \left(1 + \frac{t^2}{\nu}\right)^{-\frac{\nu+1}{2}}$$
Relación con la Distribución Normal
$$\text{Si } Z \sim \mathcal{N}(0,1) \text{ y } V \sim \chi^2(\nu) \text{ son independientes, entonces}$$ $$\frac{Z}{\sqrt{V/\nu}} \sim t(\nu)$$

Origen matemático de la distribución t: La distribución t de Student surge de la combinación de una distribución normal estándar y una distribución chi-cuadrado. Si tenemos una variable aleatoria $Z$ con distribución normal estándar ($Z \sim N(0,1)$) y una variable $V$ con distribución chi-cuadrado con $\nu$ grados de libertad ($V \sim \chi^2(\nu)$), y ambas son independientes, entonces el cociente:

$$T = \frac{Z}{\sqrt{V/\nu}}$$

sigue una distribución t con $\nu$ grados de libertad. Esta relación es fundamental en estadística, ya que explica cómo la distribución t aparece naturalmente al estandarizar la media muestral cuando la varianza poblacional es desconocida y se estima a partir de los datos.

Momentos (cuando existen)
$$\text{Media: } E[T] = 0 \quad (\text{si } \nu > 1)$$ $$\text{Varianza: } \text{Var}(T) = \frac{\nu}{\nu-2} \quad (\text{si } \nu > 2)$$ $$\text{Asimetría: } \gamma_1 = 0 \quad (\text{si } \nu > 3)$$ $$\text{Curtosis: } \gamma_2 = 3 + \frac{6}{\nu-4} \quad (\text{si } \nu > 4)$$

Nota: La función generadora de momentos no está definida para la distribución t de Student, lo que significa que no existe una expresión cerrada para $M_T(t) = E[e^{tT}]$.

Aplicaciones Estadísticas
  • • Pruebas t para una muestra: $t = \frac{\bar{X} - \mu_0}{s/\sqrt{n}}$
  • • Pruebas t para dos muestras: $t = \frac{\bar{X}_1 - \bar{X}_2}{s_p\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}$
  • • Intervalos de confianza: $\bar{X} \pm t_{\alpha/2, \nu} \cdot \frac{s}{\sqrt{n}}$
  • • Regresión lineal: pruebas de hipótesis sobre coeficientes
  • • Análisis de diseños experimentales con varianza desconocida
¿Qué son los Grados de Libertad?

En estadística, los grados de libertad ($\nu$) representan el número de valores independientes en un cálculo estadístico que pueden variar libremente. En el contexto de la distribución t de Student:

Cuando estimamos la varianza muestral $s^2$ a partir de $n$ observaciones:

$$s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})^2$$

Los grados de libertad son $\nu = n - 1$ porque:

  1. Calculamos la media muestral $\bar{X}$, que impone una restricción lineal sobre los datos
  2. Solo $n - 1$ desviaciones $(X_i - \bar{X})$ son independientes
  3. La última desviación queda determinada por las anteriores

Interpretación intuitiva: Los grados de libertad representan la "cantidad de información" disponible para estimar parámetros. A mayor $\nu$, más precisa es la estimación de la varianza y más se aproxima la distribución t a la normal.

En la distribución t, los grados de libertad controlan el peso de las colas:

  • Con $\nu$ pequeños ($\nu < 30$): Colas más pesadas, mayor probabilidad de valores extremos
  • Con $\nu$ grandes ($\nu > 30$): La distribución se aproxima a la normal estándar $\mathcal{N}(0,1)$
Parámetro: $\nu > 0$ (grados de libertad) Dominio: $t \in (-\infty, +\infty)$ Colas: Pesadas (leptocúrtica) Simetría: Alrededor de 0 Aproximación: $\lim_{\nu \to \infty} t(\nu) = \mathcal{N}(0,1)$
Grados libertad (ν):
1 30
5
Comparar con Normal:
Distribución t-Student
Comparación detallada con la Distribución Normal
Propiedad Distribución t de Student Distribución Normal
Forma Campana simétrica con colas más pesadas Campana simétrica
Media $0$ (para $\nu > 1$) $\mu$ (cualquier valor real)
Varianza $\frac{\nu}{\nu-2}$ (para $\nu > 2$) $\sigma^2$
Colas Más pesadas, mayor probabilidad en extremos Menos pesadas, decae más rápido
Uso Muestras pequeñas, varianza desconocida Muestras grandes, varianza conocida
Convergencia Converge a Normal cuando $\nu \to \infty$ No aplica

Desarrollada por William Sealy Gosset (bajo el seudónimo "Student") mientras trabajaba en la cervecería Guinness, esta distribución emerge al estimar medias poblacionales con varianza desconocida en muestras pequeñas. Sus colas pesadas reflejan la incertidumbre adicional introducida al estimar la varianza a partir de la muestra. Es fundamental en la estadística inferencial, especialmente en pruebas de hipótesis y construcción de intervalos de confianza para muestras pequeñas.

VENTAJAS PRINCIPALES
• Permite inferencia exacta con varianza desconocida
• Mayor robustez ante valores extremos que la normal
• Proporciona intervalos de confianza apropiados para muestras pequeñas
• Fundamental en pruebas t y regresión lineal
• Convergencia conocida hacia la Normal cuando $\nu \to \infty$
• Forma de campana simétrica pero con colas más pesadas
LIMITACIONES
• Momentos de orden superior pueden no existir para $\nu$ pequeños
• La estimación de grados de libertad puede ser compleja en algunos modelos
• Menor eficiencia que la Normal cuando la varianza es conocida
• Mayor complejidad computacional para calcular probabilidades
• No es adecuada para datos muy asimétricos o con outliers extremos
📊
Pruebas de Hipótesis
La distribución t es la base de las pruebas t para una muestra, dos muestras independientes y dos muestras pareadas, permitiendo comparar medias cuando la varianza poblacional es desconocida.
📈
Intervalos de Confianza
Se utiliza para construir intervalos de confianza para la media poblacional cuando el tamaño de muestra es pequeño ($n < 30$) o cuando la varianza poblacional es desconocida.
🔬
Investigación Científica
Fundamental en experimentos científicos con tamaños muestrales limitados, donde la estimación de parámetros debe considerar la incertidumbre adicional por la estimación de varianza.
📉
Análisis de Regresión
En regresión lineal, la distribución t se utiliza para pruebas de hipótesis sobre los coeficientes de regresión cuando el error estándar se estima a partir de los datos.