statistics

Correlação

A correlação mede a força e a direção da relação linear entre duas variáveis. O coeficiente de Pearson r está em [-1, 1]: 1 = positiva perfeita, -1 = negativa perfeita, 0 = sem relação linear.

A correlação mede a força e a direção da relação linear entre duas variáveis XX e YY. O coeficiente de correlação de Pearson:

r=(xixˉ)(yiyˉ)(xixˉ)2(yiyˉ)2[1,1]r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}} \in [-1, 1]

Interpretação:

  • r=1r = 1: relação linear positiva perfeita.
  • r=1r = -1: relação linear negativa perfeita.
  • r=0r = 0: sem relação linear (mas possivelmente uma não linear!).
  • r>0.7|r| > 0.7: forte; 0.3<r<0.70.3 < |r| < 0.7: moderada; r<0.3|r| < 0.3: fraca.

Ressalvas cruciais:

  • Correlação não é causalidade. As vendas de sorvete se correlacionam com mortes por afogamento — ambas impulsionadas pelo calor.
  • Sensível a valores atípicos. Um único ponto extremo pode inverter rr.
  • Apenas linear. Uma relação quadrática perfeita y=x2y = x^2 tem r0r \approx 0 em dados simétricos.

Para relações monótonas não lineares ou por postos, use o ρ\rho de Spearman. Para associação entre categorias, use o qui-quadrado ou o V de Cramér.