Rata-rata, median, dan modus adalah tiga cara berbeda untuk merangkum "bagian tengah" suatu kumpulan data. Memilih yang salah dapat membuat analisis Anda sangat menyesatkan.
Rata-rata (rata-rata aritmetika)
Rata-rata menggunakan setiap titik data, yang merupakan kekuatan sekaligus kelemahannya. Kekuatan: meminimalkan kerugian kuadrat, cocok dengan kalkulus, mendasari regresi / varians / distribusi Gauss. Kelemahan: satu pencilan ekstrem dapat menariknya jauh dari sebagian besar data.
Gunakan rata-rata ketika data kira-kira simetris dan pencilan jarang atau sudah dihilangkan.
Median (nilai tengah)
Median adalah pengamatan di tengah setelah pengurutan. Untuk pendapatan, waktu respons, ukuran berkas, dan distribusi berekor berat lainnya, median jauh lebih representatif daripada rata-rata — Bill Gates masuk ke sebuah bar menaikkan pendapatan rata-rata tetapi nyaris tidak menggeser median.
Gunakan median untuk data miring, saat melaporkan nilai "tipikal", atau ketika ketangguhan penting.
Modus (nilai paling sering)
Modus adalah nilai yang paling sering muncul. Terutama berguna untuk data kategoris (warna favorit, jenis peramban) di mana rata-rata dan median bahkan tidak berlaku. Untuk data numerik kontinu, modus sering kali tidak ada dalam arti yang bermakna — setiap pengamatan bersifat unik.
Mana yang digunakan
| Skenario | Ukuran terbaik |
|---|---|
| Numerik simetris dan bebas pencilan | Rata-rata |
| Numerik miring (pendapatan, latensi) | Median |
| Kategoris | Modus |
| Melaporkan nilai "tipikal" ke audiens umum | Median |
| Dasar untuk kalkulus / statistik lanjutan | Rata-rata |
Jika Anda baru memulai statistika, internalisasikan ini: rata-rata untuk matematika, median untuk cerita.
Coba sendiri
Tempelkan kumpulan data apa pun ke Kalkulator Rata-rata Median Modus kami dan lihat ketiganya sekaligus.
At a glance
| Feature | Rata-rata | Median (vs Modus) |
|---|---|---|
| Dipengaruhi oleh pencilan | Sangat | Nyaris tidak |
| Bekerja untuk data kategoris | Tidak | Tidak (gunakan modus) |
| Mendasari varians / regresi | Ya | Tidak |
| Terbaik untuk distribusi miring | Tidak | Ya |
Gunakan rata-rata untuk data numerik yang simetris dan bersih; median untuk distribusi miring atau saat melaporkan nilai "tipikal"; modus untuk data kategoris.