Compare

ค่าเฉลี่ย vs มัธยฐาน vs ฐานนิยม

ค่าเฉลี่ย มัธยฐาน และ ฐานนิยม เป็นสามวิธีที่ต่างกันในการสรุป "ส่วนกลาง" ของชุดข้อมูล การเลือกผิดอาจทำให้การวิเคราะห์ของคุณเข้าใจผิดอย่างมาก

ค่าเฉลี่ย (ค่าเฉลี่ยเลขคณิต)

xˉ=1ni=1nxi\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i

ค่าเฉลี่ยใช้ทุกจุดข้อมูล ซึ่งเป็นทั้งจุดแข็งและจุดอ่อน จุดแข็ง: ทำให้การสูญเสียกำลังสองน้อยที่สุด เข้ากันได้ดีกับแคลคูลัส เป็นพื้นฐานของการถดถอย / ความแปรปรวน / การแจกแจงเกาส์ จุดอ่อน: ค่าผิดปกติสุดขั้วเพียงตัวเดียวสามารถดึงมันให้ห่างจากข้อมูลส่วนใหญ่

ใช้ค่าเฉลี่ยเมื่อข้อมูลค่อนข้างสมมาตรและค่าผิดปกติพบได้น้อยหรือถูกกำจัดไปแล้ว

มัธยฐาน (ค่ากลาง)

มัธยฐานคือค่าสังเกตที่อยู่ตรงกลางหลังจากเรียงลำดับ สำหรับรายได้ เวลาตอบสนอง ขนาดไฟล์ และการแจกแจงหางหนักอื่น ๆ มัธยฐานเป็นตัวแทนได้ดีกว่ามากเมื่อเทียบกับค่าเฉลี่ย — บิล เกตส์เดินเข้าไปในผับทำให้รายได้เฉลี่ยพุ่งขึ้นแต่มัธยฐานแทบไม่ขยับ

ใช้มัธยฐานสำหรับข้อมูลเบ้ เมื่อรายงานค่า "ทั่วไป" หรือเมื่อความทนทานสำคัญ

ฐานนิยม (ค่าที่พบบ่อยที่สุด)

ฐานนิยมคือค่าที่ปรากฏบ่อยที่สุด มีประโยชน์เป็นหลักสำหรับข้อมูลเชิงหมวดหมู่ (สีโปรด ชนิดเบราว์เซอร์) ที่ค่าเฉลี่ยและมัธยฐานใช้ไม่ได้เลย สำหรับข้อมูลตัวเลขต่อเนื่อง ฐานนิยมมักไม่มีอยู่ในความหมายที่มีนัยสำคัญใด ๆ — ทุกค่าสังเกตเป็นค่าเฉพาะ

ใช้ตัวไหน

สถานการณ์มาตรวัดที่ดีที่สุด
ตัวเลขสมมาตร ไม่มีค่าผิดปกติค่าเฉลี่ย
ตัวเลขเบ้ (รายได้ ความหน่วง)มัธยฐาน
เชิงหมวดหมู่ฐานนิยม
รายงานค่า "ทั่วไป" ต่อผู้ฟังทั่วไปมัธยฐาน
พื้นฐานสำหรับแคลคูลัส / สถิติต่อไปค่าเฉลี่ย

หากคุณเพิ่งเริ่มเรียนสถิติ ให้ซึมซับสิ่งนี้: ค่าเฉลี่ยสำหรับคณิตศาสตร์ มัธยฐานสำหรับเรื่องเล่า

ลองด้วยตัวเอง

วางชุดข้อมูลใดก็ได้ลงใน เครื่องคำนวณค่าเฉลี่ย มัธยฐาน ฐานนิยม ของเราแล้วดูทั้งสามตัวพร้อมกัน

At a glance

Featureค่าเฉลี่ยมัธยฐาน (vs ฐานนิยม)
ได้รับผลกระทบจากค่าผิดปกติอย่างมากแทบไม่
ใช้ได้กับข้อมูลเชิงหมวดหมู่ไม่ไม่ (ใช้ฐานนิยม)
เป็นพื้นฐานของความแปรปรวน / การถดถอยใช่ไม่
ดีที่สุดสำหรับการแจกแจงเบ้ไม่ใช่
Verdict

ใช้ ค่าเฉลี่ย สำหรับข้อมูลตัวเลขที่สมมาตรและสะอาด; มัธยฐาน สำหรับการแจกแจงเบ้หรือเมื่อรายงานค่า "ทั่วไป"; ฐานนิยม สำหรับข้อมูลเชิงหมวดหมู่