Мода — это значение (или значения), которое встречается в наборе данных чаще всего. В отличие от среднего и медианы, мода осмысленно применима к категориальным данным (любимый цвет, тип браузера, группа крови), где арифметика не имеет смысла.

Набор данных может быть:

Унимодальным — одна мода (например, {1, 2, 2, 3, 4})
Бимодальным — две моды (например, {1, 1, 2, 3, 3})
Мультимодальным — более двух мод
Без моды — все значения встречаются одинаково часто (типично для непрерывных данных без округления)

Для непрерывных распределений «мода» обобщается до пика функции плотности вероятности. Нормальное распределение унимодально в своём среднем; смешанные модели могут быть мультимодальными, указывая на различные подгруппы.

Мода наиболее устойчива к выбросам (одно экстремальное значение никогда не становится модой), но игнорирует большую часть данных — это плохая мера центра для симметричных числовых данных, где среднее или медиана сообщают больше.

Мода

Related resources