Мода — это значение (или значения), которое встречается в наборе данных чаще всего. В отличие от среднего и медианы, мода осмысленно применима к категориальным данным (любимый цвет, тип браузера, группа крови), где арифметика не имеет смысла.
Набор данных может быть:
- Унимодальным — одна мода (например, {1, 2, 2, 3, 4})
- Бимодальным — две моды (например, {1, 1, 2, 3, 3})
- Мультимодальным — более двух мод
- Без моды — все значения встречаются одинаково часто (типично для непрерывных данных без округления)
Для непрерывных распределений «мода» обобщается до пика функции плотности вероятности. Нормальное распределение унимодально в своём среднем; смешанные модели могут быть мультимодальными, указывая на различные подгруппы.
Мода наиболее устойчива к выбросам (одно экстремальное значение никогда не становится модой), но игнорирует большую часть данных — это плохая мера центра для симметричных числовых данных, где среднее или медиана сообщают больше.