Compare

माध्य बनाम माध्यिका बनाम बहुलक

माध्य, माध्यिका और बहुलक किसी डेटासेट के "मध्य" को संक्षेप में बताने के तीन अलग-अलग तरीके हैं। गलत वाला चुनना आपके विश्लेषण को बेहद भ्रामक बना सकता है।

माध्य (समांतर औसत)

xˉ=1ni=1nxi\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i

माध्य हर डेटा बिंदु का उपयोग करता है, जो इसकी ताकत भी है और कमज़ोरी भी। ताकत: वर्ग हानि को न्यूनतम करता है, कलन के साथ अच्छी तरह चलता है, प्रतीपगमन / प्रसरण / गाउसीय बंटन का आधार है। कमज़ोरी: एक ही चरम बाह्यमान इसे डेटा के मुख्य भाग से बहुत दूर खींच सकता है।

जब डेटा लगभग सममित हो और बाह्यमान दुर्लभ हों या पहले ही हटा दिए गए हों, तब माध्य का उपयोग करें।

माध्यिका (मध्य मान)

माध्यिका छाँटने के बाद बीच का प्रेक्षण है। आय, प्रतिक्रिया समय, फ़ाइल आकार और अन्य भारी-पुच्छ बंटनों के लिए, माध्यिका माध्य की तुलना में कहीं अधिक प्रतिनिधि होती है — बिल गेट्स के किसी पब में आने से औसत आय बढ़ जाती है पर माध्यिका मुश्किल से हिलती है।

विषम डेटा के लिए, "विशिष्ट" मान बताते समय, या जब प्रबलता मायने रखती हो, तब माध्यिका का उपयोग करें।

बहुलक (सर्वाधिक बार आने वाला मान)

बहुलक वह मान है जो सबसे अधिक बार आता है। मुख्यतः श्रेणीगत डेटा के लिए उपयोगी (पसंदीदा रंग, ब्राउज़र प्रकार) जहाँ माध्य और माध्यिका लागू ही नहीं होते। सतत संख्यात्मक डेटा के लिए बहुलक प्रायः किसी सार्थक अर्थ में मौजूद नहीं होता — हर प्रेक्षण अद्वितीय होता है।

किसका उपयोग करें

परिदृश्यसर्वोत्तम माप
सममित, बाह्यमान-रहित संख्यात्मकमाध्य
विषम संख्यात्मक (आय, विलंबता)माध्यिका
श्रेणीगतबहुलक
आम दर्शकों को "विशिष्ट" बतानामाध्यिका
आगे के कलन / सांख्यिकी का आधारमाध्य

यदि आप अभी सांख्यिकी शुरू कर रहे हैं, तो इसे आत्मसात करें: गणित के लिए माध्य, कहानियों के लिए माध्यिका

स्वयं आज़माएँ

कोई भी डेटासेट हमारे माध्य माध्यिका बहुलक कैलकुलेटर में पेस्ट करें और तीनों एक साथ देखें।

At a glance

Featureमाध्यमाध्यिका (बनाम बहुलक)
बाह्यमानों से प्रभावितअत्यधिकमुश्किल से
श्रेणीगत डेटा के लिए काम करता हैनहींनहीं (बहुलक का उपयोग करें)
प्रसरण / प्रतीपगमन का आधारहाँनहीं
विषम बंटनों के लिए सर्वोत्तमनहींहाँ
Verdict

सममित, स्वच्छ संख्यात्मक डेटा के लिए माध्य का उपयोग करें; विषम बंटनों के लिए या "विशिष्ट" मान बताते समय माध्यिका का; श्रेणीगत डेटा के लिए बहुलक का।