การถดถอยเชิงเส้น หาสายตรง ที่เหมาะสมที่สุดกับชุดจุดข้อมูล "เหมาะสมที่สุด" กำหนดโดยเกณฑ์กำลังสองน้อยที่สุด: ลดผลรวมของระยะห่างแนวตั้งกำลังสองระหว่างเส้นและจุดต่าง ๆ
ความชันและจุดตัดแกนมีคำตอบแบบปิด:
สัมประสิทธิ์การตัดสินใจ วัดคุณภาพการเหมาะสม (ระหว่าง 0 ถึง 1 ยิ่งใกล้ 1 ยิ่งเหมาะสม)
การถดถอยเชิงเส้นเป็นโมเดลพยากรณ์ที่ง่ายที่สุดและเป็นรากฐานของวิธีที่ซับซ้อนกว่า:
- การถดถอยพหุ ใช้ตัวแปรป้อนเข้าหลายตัว
- การถดถอยโลจิสติก ปรับแนวคิดนี้สำหรับผลลัพธ์ไบนารี
- Ridge / Lasso เพิ่มการปรับสมดุล
- "โมเดลเชิงเส้น" ในการเรียนรู้ของเครื่องสมัยใหม่เป็นลูกหลานโดยตรง
แม้จะเรียบง่าย การถดถอยเชิงเส้นยังคงใช้กันอย่างแพร่หลายในการเงิน (CAPM) ระบาดวิทยา เศรษฐศาสตร์ และเป็นเส้นฐานที่โมเดลที่ซับซ้อนกว่าต้องพิสูจน์ความซับซ้อนของตน