statistics

Correlación

La correlación mide la fuerza y la dirección de la relación lineal entre dos variables. El coeficiente de Pearson r está en [-1, 1]: 1 = positiva perfecta, -1 = negativa perfecta, 0 = sin relación lineal.

La correlación mide la fuerza y la dirección de la relación lineal entre dos variables XX e YY. El coeficiente de correlación de Pearson:

r=(xixˉ)(yiyˉ)(xixˉ)2(yiyˉ)2[1,1]r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}} \in [-1, 1]

Interpretación:

  • r=1r = 1: relación lineal positiva perfecta.
  • r=1r = -1: relación lineal negativa perfecta.
  • r=0r = 0: sin relación lineal (¡pero posiblemente sí una no lineal!).
  • r>0.7|r| > 0.7: fuerte; 0.3<r<0.70.3 < |r| < 0.7: moderada; r<0.3|r| < 0.3: débil.

Advertencias cruciales:

  • Correlación no es causalidad. Las ventas de helado se correlacionan con las muertes por ahogamiento — ambas impulsadas por el calor.
  • Sensible a valores atípicos. Un solo punto extremo puede invertir rr.
  • Solo lineal. Una relación cuadrática perfecta y=x2y = x^2 tiene r0r \approx 0 en datos simétricos.

Para relaciones monótonas no lineales o por rangos, usa la ρ\rho de Spearman. Para asociación entre categorías, usa chi-cuadrado o la V de Cramér.