statistics

Мода

Мода — это значение, которое встречается в наборе данных чаще всего. У набора данных может быть одна мода, несколько мод или ни одной. Полезна для категориальных данных.

Мода — это значение (или значения), которое встречается в наборе данных чаще всего. В отличие от среднего и медианы, мода осмысленно применима к категориальным данным (любимый цвет, тип браузера, группа крови), где арифметика не имеет смысла.

Набор данных может быть:

  • Унимодальным — одна мода (например, {1, 2, 2, 3, 4})
  • Бимодальным — две моды (например, {1, 1, 2, 3, 3})
  • Мультимодальным — более двух мод
  • Без моды — все значения встречаются одинаково часто (типично для непрерывных данных без округления)

Для непрерывных распределений «мода» обобщается до пика функции плотности вероятности. Нормальное распределение унимодально в своём среднем; смешанные модели могут быть мультимодальными, указывая на различные подгруппы.

Мода наиболее устойчива к выбросам (одно экстремальное значение никогда не становится модой), но игнорирует большую часть данных — это плохая мера центра для симметричных числовых данных, где среднее или медиана сообщают больше.