statistics

Mediana

La mediana è il valore centrale di un insieme di dati ordinato. Per dati di dimensione pari, è la media dei due valori centrali. È robusta ai valori anomali.

La mediana è il valore centrale di un insieme di dati ordinato. Con nn dati ordinati in modo crescente:

  • Se nn è dispari, la mediana è il (n+12)\left(\frac{n+1}{2}\right)-esimo valore.
  • Se nn è pari, la mediana è la media del n2\frac{n}{2}-esimo e del (n2+1)\left(\frac{n}{2}+1\right)-esimo valore.

La mediana è la più robusta tra le misure di tendenza centrale standard. Mentre la media si sposta drasticamente per effetto di un singolo valore anomalo estremo, la mediana ne resta inalterata. È per questo che gli economisti riportano il reddito familiare mediano anziché la media — se Bezos si trasferisse in un isolato cittadino, il reddito medio schizzerebbe ai milioni, mentre la mediana rimarrebbe intatta.

Usa la mediana per distribuzioni asimmetriche (reddito, tempo di risposta, dimensione dei file). Usa la media quando i dati sono all'incirca simmetrici e i valori anomali sono rari. La mediana è anche il valore che minimizza la somma degli scarti assoluti xic\sum |x_i - c|, in parallelo alla minimizzazione degli scarti quadratici operata dalla media.