statistics

ควอร์ไทล์

ควอร์ไทล์แบ่งชุดข้อมูลออกเป็นสี่ส่วนเท่า ๆ กัน Q1 (เปอร์เซ็นไทล์ที่ 25), Q2 (มัธยฐาน, ที่ 50), Q3 (ที่ 75) พิสัยระหว่างควอร์ไทล์ Q3-Q1 เป็นการวัดการกระจายที่ทนทาน

ควอร์ไทล์ แบ่งชุดข้อมูลที่เรียงลำดับแล้วออกเป็นสี่ส่วนที่มีขนาดเท่ากัน:

  • Q1 (เปอร์เซ็นไทล์ที่ 25): หนึ่งในสี่อยู่ต่ำกว่า
  • Q2 (มัธยฐาน, ที่ 50): ครึ่งหนึ่งอยู่ต่ำกว่า
  • Q3 (เปอร์เซ็นไทล์ที่ 75): สามในสี่อยู่ต่ำกว่า

พิสัยระหว่างควอร์ไทล์ (IQR) =Q3Q1= Q3 - Q1 เป็นการวัดการกระจายที่ทนทาน:

  • ไม่ไวต่อค่าผิดปกติ (ต่างจาก σ\sigma)
  • ครอบคลุม "50% ตรงกลาง" ของข้อมูล

สรุปห้าจำนวน (min,Q1,Q2,Q3,max\min, Q1, Q2, Q3, \max) เป็นพื้นฐานของแผนภาพกล่อง: กล่องจาก Q1 ถึง Q3 พร้อมเส้นมัธยฐาน หนวดยืดไปยังค่าที่สุดขั้วที่สุดภายใน 1.5IQR1.5 \cdot IQR จุดที่อยู่เลยออกไปถูกทำเครื่องหมายเป็นค่าผิดปกติ

ควอร์ไทล์ เช่นเดียวกับเปอร์เซ็นไทล์ทั้งหมด เป็นวิธีไม่อิงพารามิเตอร์ — ไม่ตั้งข้อสมมติเกี่ยวกับรูปร่างของการแจกแจง จึงปลอดภัยกว่าค่าเฉลี่ย/ส่วนเบี่ยงเบนมาตรฐานสำหรับการแจกแจงที่เบ้หรือไม่ทราบ