Media, mediana e moda sono tre modi diversi di riassumere "il centro" di un insieme di dati. Sceglierne quello sbagliato può rendere la tua analisi estremamente fuorviante.
Media (media aritmetica)
La media usa ogni punto dati, il che è la sua forza e la sua debolezza. Forza: minimizza la perdita quadratica, si sposa bene con l'analisi, è alla base di regressione / varianza / distribuzioni gaussiane. Debolezza: un singolo valore anomalo estremo può trascinarla lontano dal grosso dei dati.
Usa la media quando i dati sono all'incirca simmetrici e i valori anomali sono rari o già rimossi.
Mediana (valore centrale)
La mediana è l'osservazione centrale dopo l'ordinamento. Per reddito, tempo di risposta, dimensione dei file e altre distribuzioni a coda pesante, la mediana è molto più rappresentativa della media — se Bill Gates entra in un pub il reddito medio si impenna ma la mediana si muove appena.
Usa la mediana per dati asimmetrici, quando riporti un valore "tipico" o quando conta la robustezza.
Moda (valore più frequente)
La moda è il valore che ricorre più spesso. Utile soprattutto per i dati categoriali (colore preferito, tipo di browser) dove media e mediana non si applicano nemmeno. Per dati numerici continui la moda spesso non esiste in alcun senso significativo — ogni osservazione è unica.
Quale usare
| Scenario | Misura migliore |
|---|---|
| Numerico simmetrico e senza valori anomali | Media |
| Numerico asimmetrico (reddito, latenza) | Mediana |
| Categoriale | Moda |
| Riportare un valore "tipico" a un pubblico generale | Mediana |
| Base per ulteriore analisi / statistica | Media |
Se hai appena iniziato con la statistica, interiorizza questo: media per la matematica, mediana per le storie.
Provale tu stesso
Incolla un qualsiasi insieme di dati nella nostra calcolatrice di media, mediana e moda e vedi tutte e tre in una volta.
At a glance
| Feature | Media | Mediana (vs moda) |
|---|---|---|
| Influenzata dai valori anomali | Molto | Appena |
| Funziona per i dati categoriali | No | No (usa la moda) |
| È alla base di varianza / regressione | Sì | No |
| La migliore per distribuzioni asimmetriche | No | Sì |
Usa la media per dati numerici simmetrici e puliti; la mediana per distribuzioni asimmetriche o quando riporti un valore "tipico"; la moda per i dati categoriali.