statistics

ارتباط

ارتباط دو متغیرات کے درمیان خطی تعلق کی طاقت اور سمت کو ناپتا ہے۔ پیئرسن عددِ ضرب r، [-1, 1] میں ہوتا ہے: 1 = کامل مثبت، -1 = کامل منفی، 0 = کوئی خطی تعلق نہیں۔

ارتباط دو متغیرات XX اور YY کے درمیان خطی تعلق کی طاقت اور سمت کو ناپتا ہے۔ پیئرسن ارتباطی عددِ ضرب:

r=(xixˉ)(yiyˉ)(xixˉ)2(yiyˉ)2[1,1]r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}} \in [-1, 1]

تعبیر:

  • r=1r = 1: کامل مثبت خطی تعلق۔
  • r=1r = -1: کامل منفی خطی تعلق۔
  • r=0r = 0: کوئی خطی تعلق نہیں (لیکن ممکنہ طور پر کوئی غیر خطی تعلق ہو!)۔
  • r>0.7|r| > 0.7: مضبوط؛ 0.3<r<0.70.3 < |r| < 0.7: معتدل؛ r<0.3|r| < 0.3: کمزور۔

اہم احتیاطیں:

  • ارتباط سببیت نہیں ہے۔ آئس کریم کی فروخت کا ڈوبنے سے ہونے والی اموات کے ساتھ ارتباط ہوتا ہے — دونوں گرم موسم سے پیدا ہوتے ہیں۔
  • بیرونی قدروں کے لیے حساس۔ ایک ہی انتہائی نقطہ rr کو الٹ سکتا ہے۔
  • صرف خطی۔ ایک کامل تربیعی تعلق y=x2y = x^2 کا متناظر ڈیٹا کے گرد r0r \approx 0 ہوتا ہے۔

درجہ بند / غیر خطی یکطرفہ تعلقات کے لیے، سپیئرمین کا ρ\rho استعمال کریں۔ زمرہ وار تعلق کے لیے، کائی مربع یا کریمر کا V استعمال کریں۔