statistics

الانحدار الخطي

يلائم الانحدار الخطي مستقيماً للبيانات: y = mx + b. ويُصغّر هذا المستقيم مجموع مربّعات المسافات الرأسية إلى النقاط (المربّعات الصغرى).

يجد الانحدار الخطي المستقيم y=mx+by = mx + b الأفضل ملاءمةً لمجموعة من نقاط البيانات (x,y)(x, y). ويُعرَّف "الأفضل" بـمعيار المربّعات الصغرى: تصغير مجموع مربّعات المسافات الرأسية بين المستقيم والنقاط.

للميل والمقطع حلولٌ مغلقة الصيغة:

m=nxyxynx2(x)2,b=yˉmxˉm = \frac{n\sum xy - \sum x \sum y}{n\sum x^2 - (\sum x)^2}, \qquad b = \bar{y} - m\bar{x}

يقيس معامل التحديد R2R^2 جودة الملاءمة (بين 0 و 1؛ وكلّما اقترب من 1 كانت الملاءمة أفضل).

الانحدار الخطي هو أبسط نموذج تنبّؤي وأساس طرائق أكثر تطوّراً:

  • يستخدم الانحدار المتعدّد عدّة مدخلات.
  • يكيّف الانحدار اللوجستي الفكرة للنتائج الثنائية.
  • يضيف Ridge / Lasso تنظيماً.
  • "النماذج الخطية" في تعلّم الآلة الحديث أحفاد مباشرون له.

ورغم بساطته، يبقى الانحدار الخطي مستخدَماً بكثرة في المالية (CAPM)، وعلم الأوبئة، والاقتصاد، وكخطّ أساس يجب على النماذج الأكثر تعقيداً أن تبرّر تعقيدها أمامه.