statistics

सहसंबंध

सहसंबंध दो चरों के बीच रैखिक संबंध की प्रबलता और दिशा को मापता है। पियर्सन गुणांक r [-1, 1] में होता है: 1 = पूर्ण धनात्मक, -1 = पूर्ण ऋणात्मक, 0 = कोई रैखिक संबंध नहीं।

सहसंबंध दो चरों XX और YY के बीच रैखिक संबंध की प्रबलता और दिशा को मापता है। पियर्सन सहसंबंध गुणांक:

r=(xixˉ)(yiyˉ)(xixˉ)2(yiyˉ)2[1,1]r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}} \in [-1, 1]

व्याख्या:

  • r=1r = 1: पूर्ण धनात्मक रैखिक संबंध।
  • r=1r = -1: पूर्ण ऋणात्मक रैखिक संबंध।
  • r=0r = 0: कोई रैखिक संबंध नहीं (परन्तु संभवतः कोई अरैखिक संबंध हो सकता है!)।
  • r>0.7|r| > 0.7: प्रबल; 0.3<r<0.70.3 < |r| < 0.7: मध्यम; r<0.3|r| < 0.3: दुर्बल।

महत्वपूर्ण चेतावनियाँ:

  • सहसंबंध कारणता नहीं है। आइसक्रीम की बिक्री डूबने से होने वाली मौतों के साथ सहसंबद्ध है — दोनों गर्म मौसम से प्रेरित हैं।
  • बहिर्मानों के प्रति संवेदनशील। एक अकेला चरम बिंदु rr को पलट सकता है।
  • केवल रैखिक। एक पूर्ण द्विघात संबंध y=x2y = x^2 सममित आँकड़ों के आसपास r0r \approx 0 देता है।

रैंक-आधारित / अरैखिक एकदिष्ट संबंधों के लिए स्पीयरमैन का ρ\rho उपयोग करें। श्रेणीगत साहचर्य के लिए काई-वर्ग या क्रामर का V उपयोग करें।