相関は 2 つの変数 X と Y の間の線形関係の強さと向きを測る。ピアソンの相関係数:
r=∑(xi−xˉ)2∑(yi−yˉ)2∑(xi−xˉ)(yi−yˉ)∈[−1,1]
解釈:
- r=1:完全な正の線形関係。
- r=−1:完全な負の線形関係。
- r=0:線形関係なし(ただし非線形の関係はあり得る!)。
- ∣r∣>0.7:強い;0.3<∣r∣<0.7:中程度;∣r∣<0.3:弱い。
重要な注意点:
- 相関は因果ではない。アイスクリームの売上は溺死者数と相関する——どちらも暑い天候によって引き起こされる。
- 外れ値に敏感。たった 1 つの極端な点が r を反転させ得る。
- 線形のみ。完全な二次関係 y=x2 は対称なデータの周りでは r≈0 となる。
順位や非線形の単調な関係にはスピアマンの ρ を、カテゴリ間の関連にはカイ二乗やクラメールの V を用いる。