statistics

Mediana

La mediana es el valor central de un conjunto de datos ordenado. Para conjuntos de tamaño par, es el promedio de los dos valores centrales. Es robusta frente a valores atípicos.

La mediana es el valor central de un conjunto de datos ordenado. Con nn datos ordenados de forma ascendente:

  • Si nn es impar, la mediana es el valor que ocupa la posición (n+12)\left(\frac{n+1}{2}\right).
  • Si nn es par, la mediana es el promedio de los valores en las posiciones n2\frac{n}{2} y (n2+1)\left(\frac{n}{2}+1\right).

La mediana es la más robusta de las medidas de centralidad estándar. Mientras que la media se desplaza drásticamente con un único valor atípico extremo, la mediana no se ve afectada. Por eso los economistas reportan el ingreso familiar mediano en lugar del medio: si Bezos apareciera en una manzana de la ciudad, empujaría el ingreso medio a millones, mientras dejaría la mediana intacta.

Usa la mediana para distribuciones asimétricas (ingresos, tiempo de respuesta, tamaño de archivo). Usa la media cuando los datos son aproximadamente simétricos y los valores atípicos son raros. La mediana es también el valor que minimiza la suma de desviaciones absolutas xic\sum |x_i - c|, en paralelo con la minimización de desviaciones cuadráticas que hace la media.