ค่าเฉลี่ย มัธยฐาน และ ฐานนิยม เป็นสามวิธีที่ต่างกันในการสรุป "ส่วนกลาง" ของชุดข้อมูล การเลือกผิดอาจทำให้การวิเคราะห์ของคุณเข้าใจผิดอย่างมาก
ค่าเฉลี่ย (ค่าเฉลี่ยเลขคณิต)
ค่าเฉลี่ยใช้ทุกจุดข้อมูล ซึ่งเป็นทั้งจุดแข็งและจุดอ่อน จุดแข็ง: ทำให้การสูญเสียกำลังสองน้อยที่สุด เข้ากันได้ดีกับแคลคูลัส เป็นพื้นฐานของการถดถอย / ความแปรปรวน / การแจกแจงเกาส์ จุดอ่อน: ค่าผิดปกติสุดขั้วเพียงตัวเดียวสามารถดึงมันให้ห่างจากข้อมูลส่วนใหญ่
ใช้ค่าเฉลี่ยเมื่อข้อมูลค่อนข้างสมมาตรและค่าผิดปกติพบได้น้อยหรือถูกกำจัดไปแล้ว
มัธยฐาน (ค่ากลาง)
มัธยฐานคือค่าสังเกตที่อยู่ตรงกลางหลังจากเรียงลำดับ สำหรับรายได้ เวลาตอบสนอง ขนาดไฟล์ และการแจกแจงหางหนักอื่น ๆ มัธยฐานเป็นตัวแทนได้ดีกว่ามากเมื่อเทียบกับค่าเฉลี่ย — บิล เกตส์เดินเข้าไปในผับทำให้รายได้เฉลี่ยพุ่งขึ้นแต่มัธยฐานแทบไม่ขยับ
ใช้มัธยฐานสำหรับข้อมูลเบ้ เมื่อรายงานค่า "ทั่วไป" หรือเมื่อความทนทานสำคัญ
ฐานนิยม (ค่าที่พบบ่อยที่สุด)
ฐานนิยมคือค่าที่ปรากฏบ่อยที่สุด มีประโยชน์เป็นหลักสำหรับข้อมูลเชิงหมวดหมู่ (สีโปรด ชนิดเบราว์เซอร์) ที่ค่าเฉลี่ยและมัธยฐานใช้ไม่ได้เลย สำหรับข้อมูลตัวเลขต่อเนื่อง ฐานนิยมมักไม่มีอยู่ในความหมายที่มีนัยสำคัญใด ๆ — ทุกค่าสังเกตเป็นค่าเฉพาะ
ใช้ตัวไหน
| สถานการณ์ | มาตรวัดที่ดีที่สุด |
|---|---|
| ตัวเลขสมมาตร ไม่มีค่าผิดปกติ | ค่าเฉลี่ย |
| ตัวเลขเบ้ (รายได้ ความหน่วง) | มัธยฐาน |
| เชิงหมวดหมู่ | ฐานนิยม |
| รายงานค่า "ทั่วไป" ต่อผู้ฟังทั่วไป | มัธยฐาน |
| พื้นฐานสำหรับแคลคูลัส / สถิติต่อไป | ค่าเฉลี่ย |
หากคุณเพิ่งเริ่มเรียนสถิติ ให้ซึมซับสิ่งนี้: ค่าเฉลี่ยสำหรับคณิตศาสตร์ มัธยฐานสำหรับเรื่องเล่า
ลองด้วยตัวเอง
วางชุดข้อมูลใดก็ได้ลงใน เครื่องคำนวณค่าเฉลี่ย มัธยฐาน ฐานนิยม ของเราแล้วดูทั้งสามตัวพร้อมกัน
At a glance
| Feature | ค่าเฉลี่ย | มัธยฐาน (vs ฐานนิยม) |
|---|---|---|
| ได้รับผลกระทบจากค่าผิดปกติ | อย่างมาก | แทบไม่ |
| ใช้ได้กับข้อมูลเชิงหมวดหมู่ | ไม่ | ไม่ (ใช้ฐานนิยม) |
| เป็นพื้นฐานของความแปรปรวน / การถดถอย | ใช่ | ไม่ |
| ดีที่สุดสำหรับการแจกแจงเบ้ | ไม่ | ใช่ |
ใช้ ค่าเฉลี่ย สำหรับข้อมูลตัวเลขที่สมมาตรและสะอาด; มัธยฐาน สำหรับการแจกแจงเบ้หรือเมื่อรายงานค่า "ทั่วไป"; ฐานนิยม สำหรับข้อมูลเชิงหมวดหมู่