statistics

Median

Der Median ist der mittlere Wert eines sortierten Datensatzes. Bei einer geraden Anzahl von Werten ist er der Durchschnitt der beiden mittleren Werte. Er ist robust gegenüber Ausreißern.

Der Median ist der mittlere Wert eines geordneten Datensatzes. Bei nn aufsteigend sortierten Datenpunkten gilt:

  • Ist nn ungerade, so ist der Median der (n+12)\left(\frac{n+1}{2}\right)-te Wert.
  • Ist nn gerade, so ist der Median der Durchschnitt des n2\frac{n}{2}-ten und des (n2+1)\left(\frac{n}{2}+1\right)-ten Wertes.

Der Median ist das robusteste der gebräuchlichen Lagemaße. Während sich das arithmetische Mittel durch einen einzigen extremen Ausreißer dramatisch verschiebt, bleibt der Median unbeeinflusst. Deshalb berichten Ökonomen das mediane Haushaltseinkommen statt des Mittelwerts — wenn Bezos einen Häuserblock betritt, würde das mittlere Einkommen in die Millionen schnellen, der Median aber unverändert bleiben.

Verwende den Median für schiefe Verteilungen (Einkommen, Antwortzeit, Dateigröße). Verwende das Mittel, wenn die Daten annähernd symmetrisch sind und Ausreißer selten vorkommen. Der Median ist außerdem der Wert, der die Summe der absoluten Abweichungen xic\sum |x_i - c| minimiert, analog dazu, dass das Mittel die quadratischen Abweichungen minimiert.