statistics

สหสัมพันธ์

สหสัมพันธ์วัดความแรงและทิศทางของความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว สัมประสิทธิ์เพียร์สัน r อยู่ในช่วง [-1, 1]: 1 = บวกสมบูรณ์, -1 = ลบสมบูรณ์, 0 = ไม่มีความสัมพันธ์เชิงเส้น

สหสัมพันธ์ วัดความแรงและทิศทางของความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว XX และ YY สัมประสิทธิ์สหสัมพันธ์เพียร์สัน:

r=(xixˉ)(yiyˉ)(xixˉ)2(yiyˉ)2[1,1]r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}} \in [-1, 1]

การตีความ:

  • r=1r = 1: ความสัมพันธ์เชิงเส้นทางบวกที่สมบูรณ์
  • r=1r = -1: ความสัมพันธ์เชิงเส้นทางลบที่สมบูรณ์
  • r=0r = 0: ไม่มีความสัมพันธ์ เชิงเส้น (แต่อาจมีความสัมพันธ์แบบไม่เชิงเส้นได้!)
  • r>0.7|r| > 0.7: แรง; 0.3<r<0.70.3 < |r| < 0.7: ปานกลาง; r<0.3|r| < 0.3: อ่อน

ข้อควรระวังสำคัญ:

  • สหสัมพันธ์ไม่ใช่ความเป็นเหตุเป็นผล ยอดขายไอศกรีมมีสหสัมพันธ์กับจำนวนผู้เสียชีวิตจากการจมน้ำ — ทั้งสองเกิดจากอากาศร้อน
  • ไวต่อค่านอกเกณฑ์ จุดสุดขั้วเพียงจุดเดียวสามารถพลิก rr ได้
  • เชิงเส้นเท่านั้น ความสัมพันธ์กำลังสองที่สมบูรณ์ y=x2y = x^2 ให้ r0r \approx 0 รอบ ๆ ข้อมูลที่สมมาตร

สำหรับความสัมพันธ์ทางเดียวแบบไม่เชิงเส้นหรืออิงอันดับ ให้ใช้ ρ\rho ของสเปียร์แมน สำหรับความสัมพันธ์เชิงกลุ่ม ให้ใช้ ไคสแควร์ หรือ V ของคราเมร์