statistics

रैखिक समाश्रयण

रैखिक समाश्रयण आँकड़ों पर एक सरल रेखा फिट करता है: y = mx + b। यह रेखा बिंदुओं तक की ऊर्ध्वाधर दूरियों के वर्गों के योग को न्यूनतम करती है (न्यूनतम वर्ग)।

रैखिक समाश्रयण वह सरल रेखा y=mx+by = mx + b ढूँढ़ता है जो (x,y)(x, y) आँकड़ा-बिंदुओं के समुच्चय में सबसे अच्छी फिट होती है। "सबसे अच्छी" को न्यूनतम वर्ग कसौटी द्वारा परिभाषित किया जाता है: रेखा और बिंदुओं के बीच की ऊर्ध्वाधर दूरियों के वर्गों के योग को न्यूनतम करना।

ढाल और अंतःखंड के लिए संवृत-रूप हल होते हैं:

m=nxyxynx2(x)2,b=yˉmxˉm = \frac{n\sum xy - \sum x \sum y}{n\sum x^2 - (\sum x)^2}, \qquad b = \bar{y} - m\bar{x}

निर्धारण गुणांक R2R^2 फिट की गुणवत्ता मापता है (0 और 1 के बीच; 1 के जितना निकट उतनी बेहतर फिट)।

रैखिक समाश्रयण सरलतम पूर्वानुमान मॉडल है और अधिक परिष्कृत विधियों का आधार है:

  • बहु समाश्रयण कई निवेशों का उपयोग करता है।
  • लॉजिस्टिक समाश्रयण इस विचार को द्विआधारी परिणामों के लिए अनुकूलित करता है।
  • रिज / लासो नियमितीकरण जोड़ते हैं।
  • आधुनिक मशीन लर्निंग के "रैखिक मॉडल" इसके सीधे वंशज हैं।

अपनी सरलता के बावजूद, रैखिक समाश्रयण वित्त (CAPM), महामारी विज्ञान, अर्थशास्त्र में, तथा एक आधार-रेखा के रूप में, जिसके सापेक्ष अधिक दिखावटी मॉडलों को अपनी जटिलता उचित ठहरानी पड़ती है, अब भी व्यापक रूप से प्रयुक्त होता है।