La corrélation mesure la force et le sens de la relation linéaire entre deux variables et . Le coefficient de corrélation de Pearson :
Interprétation :
- : relation linéaire positive parfaite.
- : relation linéaire négative parfaite.
- : aucune relation linéaire (mais éventuellement une relation non linéaire !).
- : forte ; : modérée ; : faible.
Mises en garde essentielles :
- Corrélation n'est pas causalité. Les ventes de glaces sont corrélées aux noyades — les deux sont dues au temps chaud.
- Sensible aux valeurs aberrantes. Un seul point extrême peut inverser .
- Linéaire seulement. Une relation quadratique parfaite donne autour de données symétriques.
Pour des relations monotones par rangs ou non linéaires, utilisez le de Spearman. Pour une association entre catégories, utilisez le khi-deux ou le V de Cramér.