statistics

प्रسरण

प्रसरण किसी डेटासमुच्चय के अपने माध्य के चारों ओर के फैलाव को मापता है। यह विचलनों के वर्गों का औसत है। मानक विचलन प्रसरण का वर्गमूल होता है।

प्रसरण मापता है कि किसी डेटासमुच्चय के मान माध्य से कितनी दूर फैले हैं। माध्य μ\mu वाले NN मानों x1,,xNx_1, \ldots, x_N की समष्टि के लिए:

σ2=1Ni=1N(xiμ)2\sigma^2 = \frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2

प्रतिदर्श माध्य xˉ\bar{x} वाले nn मानों के प्रतिदर्श के लिए, nn के बजाय n1n - 1 से भाग दें (बेसेल संशोधन, एक अनभिनत आकलक)।

छोटा प्रसरण दर्शाता है कि मान माध्य के पास गुच्छित हैं; बड़ा प्रसरण दर्शाता है कि वे बिखरे हुए हैं। प्रसरण मूल डेटा की वर्ग इकाइयों में होता है (यदि डेटा kg में है तो kg²) — इसीलिए हम सामान्यतः मानक विचलन σ=σ2\sigma = \sqrt{\sigma^2} बताते हैं, जिसकी इकाइयाँ डेटा जैसी ही होती हैं।

प्रसरण समस्त निगमनात्मक सांख्यिकी का आधार है: विश्वास अंतराल, परिकल्पना परीक्षण और समाश्रयण सभी प्रसरण के आकलन पर निर्भर करते हैं। मशीन लर्निंग में अभिनति-प्रसरण समझौता इसी के नाम पर रखा गया है।