माध्य, माध्यिका और बहुलक किसी डेटासेट के "मध्य" को संक्षेप में बताने के तीन अलग-अलग तरीके हैं। गलत वाला चुनना आपके विश्लेषण को बेहद भ्रामक बना सकता है।
माध्य (समांतर औसत)
माध्य हर डेटा बिंदु का उपयोग करता है, जो इसकी ताकत भी है और कमज़ोरी भी। ताकत: वर्ग हानि को न्यूनतम करता है, कलन के साथ अच्छी तरह चलता है, प्रतीपगमन / प्रसरण / गाउसीय बंटन का आधार है। कमज़ोरी: एक ही चरम बाह्यमान इसे डेटा के मुख्य भाग से बहुत दूर खींच सकता है।
जब डेटा लगभग सममित हो और बाह्यमान दुर्लभ हों या पहले ही हटा दिए गए हों, तब माध्य का उपयोग करें।
माध्यिका (मध्य मान)
माध्यिका छाँटने के बाद बीच का प्रेक्षण है। आय, प्रतिक्रिया समय, फ़ाइल आकार और अन्य भारी-पुच्छ बंटनों के लिए, माध्यिका माध्य की तुलना में कहीं अधिक प्रतिनिधि होती है — बिल गेट्स के किसी पब में आने से औसत आय बढ़ जाती है पर माध्यिका मुश्किल से हिलती है।
विषम डेटा के लिए, "विशिष्ट" मान बताते समय, या जब प्रबलता मायने रखती हो, तब माध्यिका का उपयोग करें।
बहुलक (सर्वाधिक बार आने वाला मान)
बहुलक वह मान है जो सबसे अधिक बार आता है। मुख्यतः श्रेणीगत डेटा के लिए उपयोगी (पसंदीदा रंग, ब्राउज़र प्रकार) जहाँ माध्य और माध्यिका लागू ही नहीं होते। सतत संख्यात्मक डेटा के लिए बहुलक प्रायः किसी सार्थक अर्थ में मौजूद नहीं होता — हर प्रेक्षण अद्वितीय होता है।
किसका उपयोग करें
| परिदृश्य | सर्वोत्तम माप |
|---|---|
| सममित, बाह्यमान-रहित संख्यात्मक | माध्य |
| विषम संख्यात्मक (आय, विलंबता) | माध्यिका |
| श्रेणीगत | बहुलक |
| आम दर्शकों को "विशिष्ट" बताना | माध्यिका |
| आगे के कलन / सांख्यिकी का आधार | माध्य |
यदि आप अभी सांख्यिकी शुरू कर रहे हैं, तो इसे आत्मसात करें: गणित के लिए माध्य, कहानियों के लिए माध्यिका।
स्वयं आज़माएँ
कोई भी डेटासेट हमारे माध्य माध्यिका बहुलक कैलकुलेटर में पेस्ट करें और तीनों एक साथ देखें।
At a glance
| Feature | माध्य | माध्यिका (बनाम बहुलक) |
|---|---|---|
| बाह्यमानों से प्रभावित | अत्यधिक | मुश्किल से |
| श्रेणीगत डेटा के लिए काम करता है | नहीं | नहीं (बहुलक का उपयोग करें) |
| प्रसरण / प्रतीपगमन का आधार | हाँ | नहीं |
| विषम बंटनों के लिए सर्वोत्तम | नहीं | हाँ |
सममित, स्वच्छ संख्यात्मक डेटा के लिए माध्य का उपयोग करें; विषम बंटनों के लिए या "विशिष्ट" मान बताते समय माध्यिका का; श्रेणीगत डेटा के लिए बहुलक का।