statistics

ฐานนิยม

ฐานนิยมคือค่าที่ปรากฏบ่อยที่สุดในชุดข้อมูล ชุดข้อมูลอาจมีฐานนิยมหนึ่งค่า หลายค่า หรือไม่มีเลยก็ได้ มีประโยชน์สำหรับข้อมูลเชิงประเภท

ฐานนิยม คือค่า (หรือหลายค่า) ที่ปรากฏบ่อยที่สุดในชุดข้อมูล ต่างจากค่าเฉลี่ยและค่ามัธยฐาน ฐานนิยมใช้ได้อย่างมีความหมายกับข้อมูลเชิงประเภท (สีโปรด ประเภทเบราว์เซอร์ กลุ่มเลือด) ซึ่งไม่สามารถคำนวณทางเลขคณิตได้

ชุดข้อมูลอาจมีลักษณะ:

  • ยอดเดียว — ฐานนิยมหนึ่งค่า (เช่น {1, 2, 2, 3, 4})
  • สองยอด — ฐานนิยมสองค่า (เช่น {1, 1, 2, 3, 3})
  • หลายยอด — ฐานนิยมมากกว่าสองค่า
  • ไม่มีฐานนิยม — ทุกค่าปรากฏบ่อยเท่ากัน (พบได้ในข้อมูลต่อเนื่องที่ไม่ปัดเศษ)

สำหรับการแจกแจงต่อเนื่อง "ฐานนิยม" ถูกทำให้ทั่วไปเป็นยอดของฟังก์ชันความหนาแน่นความน่าจะเป็น การแจกแจงปกติมีฐานนิยมยอดเดียวที่ค่าเฉลี่ย โมเดลผสมอาจมีหลายยอด บ่งชี้ว่ามีกลุ่มย่อยที่แตกต่างกัน

ฐานนิยมมีความทนทานต่อค่าผิดปกติมากที่สุด (ค่าสุดขีดหนึ่งค่าจะไม่กลายเป็นฐานนิยม) แต่ละเลยข้อมูลส่วนใหญ่ — จึงเป็นตัวชี้วัดแนวโน้มสู่กลางที่ไม่ดีนักสำหรับข้อมูลตัวเลขที่มีความสมมาตร ซึ่งค่าเฉลี่ยหรือค่ามัธยฐานให้ข้อมูลมากกว่า