statistics

Korelasi

Korelasi mengukur kekuatan dan arah hubungan linear antara dua variabel. Koefisien Pearson r berada di [-1, 1]: 1 = positif sempurna, -1 = negatif sempurna, 0 = tidak ada hubungan linear.

Korelasi mengukur kekuatan dan arah hubungan linear antara dua variabel XX dan YY. Koefisien korelasi Pearson:

r=(xixˉ)(yiyˉ)(xixˉ)2(yiyˉ)2[1,1]r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}} \in [-1, 1]

Tafsir:

  • r=1r = 1: hubungan linear positif sempurna.
  • r=1r = -1: hubungan linear negatif sempurna.
  • r=0r = 0: tidak ada hubungan linear (tetapi mungkin ada hubungan nonlinear!).
  • r>0.7|r| > 0.7: kuat; 0.3<r<0.70.3 < |r| < 0.7: sedang; r<0.3|r| < 0.3: lemah.

Catatan penting:

  • Korelasi bukan kausalitas. Penjualan es krim berkorelasi dengan jumlah kematian akibat tenggelam — keduanya didorong oleh cuaca panas.
  • Peka terhadap pencilan. Sebuah titik ekstrem tunggal dapat membalik rr.
  • Hanya linear. Hubungan kuadratik sempurna y=x2y = x^2 menghasilkan r0r \approx 0 di sekitar data simetris.

Untuk hubungan monoton berbasis peringkat atau nonlinear, gunakan ρ\rho Spearman. Untuk asosiasi kategorik, gunakan chi-kuadrat atau V Cramér.