statistics

Процентиль

k-й процентиль — это значение, ниже которого находится k % наблюдений. 50-й процентиль — это медиана; 25-й и 75-й — это квартили.

k-й процентиль PkP_k — это значение, ниже которого находится k%k\% наблюдений в наборе данных. Распространённые процентили:

  • 25-й процентиль (Q1): нижний квартиль.
  • 50-й процентиль (Q2): медиана.
  • 75-й процентиль (Q3): верхний квартиль.
  • 90-й, 95-й, 99-й: хвосты — используются для экстремальных значений.

Межквартильный размах (IQR) = Q3Q1Q3 - Q1 — устойчивая мера разброса (нечувствительная к выбросам, в отличие от стандартного отклонения).

Вычисление: отсортируйте данные, вычислите ранг r=(k/100)(n+1)r = (k/100)(n+1), возьмите rr-е наблюдение (интерполируя между целыми рангами). Существует несколько слегка различающихся определений — Excel, R и NumPy используют разные соглашения.

Применения: баллы стандартизированных тестов, педиатрические кривые роста, задержка P99 в инженерии, диаграммы размаха. Процентили непараметричны — они не делают никаких предположений о форме распределения.