Compare

Media vs mediana vs moda

Media, mediana e moda sono tre modi diversi di riassumere "il centro" di un insieme di dati. Sceglierne quello sbagliato può rendere la tua analisi estremamente fuorviante.

Media (media aritmetica)

xˉ=1ni=1nxi\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i

La media usa ogni punto dati, il che è la sua forza e la sua debolezza. Forza: minimizza la perdita quadratica, si sposa bene con l'analisi, è alla base di regressione / varianza / distribuzioni gaussiane. Debolezza: un singolo valore anomalo estremo può trascinarla lontano dal grosso dei dati.

Usa la media quando i dati sono all'incirca simmetrici e i valori anomali sono rari o già rimossi.

Mediana (valore centrale)

La mediana è l'osservazione centrale dopo l'ordinamento. Per reddito, tempo di risposta, dimensione dei file e altre distribuzioni a coda pesante, la mediana è molto più rappresentativa della media — se Bill Gates entra in un pub il reddito medio si impenna ma la mediana si muove appena.

Usa la mediana per dati asimmetrici, quando riporti un valore "tipico" o quando conta la robustezza.

Moda (valore più frequente)

La moda è il valore che ricorre più spesso. Utile soprattutto per i dati categoriali (colore preferito, tipo di browser) dove media e mediana non si applicano nemmeno. Per dati numerici continui la moda spesso non esiste in alcun senso significativo — ogni osservazione è unica.

Quale usare

ScenarioMisura migliore
Numerico simmetrico e senza valori anomaliMedia
Numerico asimmetrico (reddito, latenza)Mediana
CategorialeModa
Riportare un valore "tipico" a un pubblico generaleMediana
Base per ulteriore analisi / statisticaMedia

Se hai appena iniziato con la statistica, interiorizza questo: media per la matematica, mediana per le storie.

Provale tu stesso

Incolla un qualsiasi insieme di dati nella nostra calcolatrice di media, mediana e moda e vedi tutte e tre in una volta.

At a glance

FeatureMediaMediana (vs moda)
Influenzata dai valori anomaliMoltoAppena
Funziona per i dati categorialiNoNo (usa la moda)
È alla base di varianza / regressioneNo
La migliore per distribuzioni asimmetricheNo
Verdict

Usa la media per dati numerici simmetrici e puliti; la mediana per distribuzioni asimmetriche o quando riporti un valore "tipico"; la moda per i dati categoriali.