statistics

الارتباط

يقيس الارتباط قوّة العلاقة الخطّية بين متغيّرين واتجاهها. معامل بيرسون r يقع في [-1, 1]: 1 = ارتباط طردي تامّ، -1 = ارتباط عكسي تامّ، 0 = لا توجد علاقة خطّية.

يقيس الارتباط قوّة العلاقة الخطّية بين متغيّرين XX و YY واتجاهها. معامل ارتباط بيرسون:

r=(xixˉ)(yiyˉ)(xixˉ)2(yiyˉ)2[1,1]r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}} \in [-1, 1]

التفسير:

  • r=1r = 1: علاقة خطّية طردية تامّة.
  • r=1r = -1: علاقة خطّية عكسية تامّة.
  • r=0r = 0: لا توجد علاقة خطّية (لكن قد توجد علاقة غير خطّية!).
  • r>0.7|r| > 0.7: قويّة؛ 0.3<r<0.70.3 < |r| < 0.7: متوسّطة؛ r<0.3|r| < 0.3: ضعيفة.

تحفّظات جوهرية:

  • الارتباط ليس سببيّة. مبيعات المثلّجات ترتبط بحالات الغرق — وكلاهما ناتج عن الطقس الحارّ.
  • حسّاس للقيم الشاذّة. نقطة متطرّفة واحدة قد تقلب إشارة rr.
  • خطّي فقط. علاقة تربيعية تامّة y=x2y = x^2 تعطي r0r \approx 0 حول بيانات متناظرة.

من أجل العلاقات الرتبية أو الرتيبة غير الخطّية، استعمل معامل سبيرمان ρ\rho. ومن أجل الارتباط بين الفئات، استعمل مربّع كاي أو معامل V لكرامر.