Compare

Rata-rata vs median vs modus

Rata-rata, median, dan modus adalah tiga cara berbeda untuk merangkum "bagian tengah" suatu kumpulan data. Memilih yang salah dapat membuat analisis Anda sangat menyesatkan.

Rata-rata (rata-rata aritmetika)

xˉ=1ni=1nxi\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i

Rata-rata menggunakan setiap titik data, yang merupakan kekuatan sekaligus kelemahannya. Kekuatan: meminimalkan kerugian kuadrat, cocok dengan kalkulus, mendasari regresi / varians / distribusi Gauss. Kelemahan: satu pencilan ekstrem dapat menariknya jauh dari sebagian besar data.

Gunakan rata-rata ketika data kira-kira simetris dan pencilan jarang atau sudah dihilangkan.

Median (nilai tengah)

Median adalah pengamatan di tengah setelah pengurutan. Untuk pendapatan, waktu respons, ukuran berkas, dan distribusi berekor berat lainnya, median jauh lebih representatif daripada rata-rata — Bill Gates masuk ke sebuah bar menaikkan pendapatan rata-rata tetapi nyaris tidak menggeser median.

Gunakan median untuk data miring, saat melaporkan nilai "tipikal", atau ketika ketangguhan penting.

Modus (nilai paling sering)

Modus adalah nilai yang paling sering muncul. Terutama berguna untuk data kategoris (warna favorit, jenis peramban) di mana rata-rata dan median bahkan tidak berlaku. Untuk data numerik kontinu, modus sering kali tidak ada dalam arti yang bermakna — setiap pengamatan bersifat unik.

Mana yang digunakan

SkenarioUkuran terbaik
Numerik simetris dan bebas pencilanRata-rata
Numerik miring (pendapatan, latensi)Median
KategorisModus
Melaporkan nilai "tipikal" ke audiens umumMedian
Dasar untuk kalkulus / statistik lanjutanRata-rata

Jika Anda baru memulai statistika, internalisasikan ini: rata-rata untuk matematika, median untuk cerita.

Coba sendiri

Tempelkan kumpulan data apa pun ke Kalkulator Rata-rata Median Modus kami dan lihat ketiganya sekaligus.

At a glance

FeatureRata-rataMedian (vs Modus)
Dipengaruhi oleh pencilanSangatNyaris tidak
Bekerja untuk data kategorisTidakTidak (gunakan modus)
Mendasari varians / regresiYaTidak
Terbaik untuk distribusi miringTidakYa
Verdict

Gunakan rata-rata untuk data numerik yang simetris dan bersih; median untuk distribusi miring atau saat melaporkan nilai "tipikal"; modus untuk data kategoris.