statistics

Mediana

A mediana é o valor central de um conjunto de dados ordenado. Para conjuntos de tamanho par, é a média dos dois valores centrais. É robusta a valores atípicos.

A mediana é o valor central de um conjunto de dados ordenado. Com nn pontos de dados ordenados de forma crescente:

  • Se nn for ímpar, a mediana é o (n+12)\left(\frac{n+1}{2}\right)-ésimo valor.
  • Se nn for par, a mediana é a média do n2\frac{n}{2}-ésimo e do (n2+1)\left(\frac{n}{2}+1\right)-ésimo valores.

A mediana é a mais robusta das medidas de centralidade padrão. Enquanto a média se desloca drasticamente com um único valor atípico extremo, a mediana não é afetada. É por isso que os economistas reportam a renda familiar mediana em vez da média — se Bezos entrasse em um quarteirão da cidade, a renda média seria empurrada para milhões, enquanto a mediana ficaria intacta.

Use a mediana para distribuições assimétricas (renda, tempo de resposta, tamanho de arquivo). Use a média quando os dados são aproximadamente simétricos e os valores atípicos são raros. A mediana é também o valor que minimiza a soma dos desvios absolutos xic\sum |x_i - c|, em paralelo à minimização dos desvios quadráticos feita pela média.