statistics

Медиана

Медиана — это среднее значение упорядоченного набора данных. При чётном количестве данных она равна среднему арифметическому двух центральных значений. Устойчива к выбросам.

Медиана — это среднее значение упорядоченного набора данных. При nn точках данных, отсортированных по возрастанию:

  • Если nn нечётно, медиана — это (n+12)\left(\frac{n+1}{2}\right)-е значение.
  • Если nn чётно, медиана — это среднее арифметическое n2\frac{n}{2}-го и (n2+1)\left(\frac{n}{2}+1\right)-го значений.

Медиана — самая устойчивая из стандартных мер центральной тенденции. В то время как среднее резко смещается из-за единственного экстремального выброса, медиана остаётся неизменной. Именно поэтому экономисты сообщают медианный доход домохозяйств, а не средний — если бы Безос появился в городском квартале, средний доход взлетел бы до миллионов, тогда как медиана осталась бы нетронутой.

Используйте медиану для асимметричных распределений (доход, время отклика, размер файла). Используйте среднее, когда данные приблизительно симметричны и выбросы редки. Медиана также является значением, минимизирующим сумму абсолютных отклонений xic\sum |x_i - c|, что соответствует минимизации квадратичных отклонений средним значением.