Compare

Mittelwert vs. Median vs. Modus

Mittelwert, Median und Modus sind drei verschiedene Arten, "die Mitte" eines Datensatzes zusammenzufassen. Den falschen zu wählen kann Ihre Analyse völlig irreführend machen.

Mittelwert (arithmetisches Mittel)

xˉ=1ni=1nxi\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i

Der Mittelwert nutzt jeden Datenpunkt, was zugleich seine Stärke und seine Schwäche ist. Stärke: minimiert den quadratischen Verlust, harmoniert mit der Analysis, liegt Regression / Varianz / Gauß-Verteilungen zugrunde. Schwäche: ein einziger extremer Ausreißer kann ihn weit vom Großteil der Daten wegziehen.

Verwenden Sie den Mittelwert, wenn die Daten ungefähr symmetrisch sind und Ausreißer selten oder bereits entfernt sind.

Median (mittlerer Wert)

Der Median ist die mittlere Beobachtung nach dem Sortieren. Für Einkommen, Antwortzeit, Dateigröße und andere stark schiefe Verteilungen ist der Median weit repräsentativer als der Mittelwert — wenn Bill Gates eine Kneipe betritt, steigt das Durchschnittseinkommen, der Median bewegt sich aber kaum.

Verwenden Sie den Median für schiefe Daten, wenn Sie einen "typischen" Wert angeben oder wenn Robustheit zählt.

Modus (häufigster Wert)

Der Modus ist der am häufigsten vorkommende Wert. Vor allem für kategoriale Daten nützlich (Lieblingsfarbe, Browsertyp), wo Mittelwert und Median gar nicht anwendbar sind. Bei kontinuierlichen numerischen Daten existiert der Modus oft in keinem sinnvollen Sinn — jede Beobachtung ist einzigartig.

Welchen verwenden

SzenarioBestes Maß
Symmetrisch, numerisch ohne AusreißerMittelwert
Schief numerisch (Einkommen, Latenz)Median
KategorialModus
"Typischen" Wert für ein allgemeines Publikum angebenMedian
Grundlage für weitere Analysis / StatistikMittelwert

Wenn Sie gerade erst mit Statistik beginnen, verinnerlichen Sie dies: Mittelwert für die Mathematik, Median für die Geschichten.

Probieren Sie es selbst

Fügen Sie einen beliebigen Datensatz in unseren Rechner für Mittelwert, Median und Modus ein und sehen Sie alle drei auf einmal.

At a glance

FeatureMittelwertMedian (vs. Modus)
Von Ausreißern beeinflusstStarkKaum
Funktioniert für kategoriale DatenNeinNein (Modus verwenden)
Liegt Varianz / Regression zugrundeJaNein
Am besten für schiefe VerteilungenNeinJa
Verdict

Verwenden Sie den Mittelwert für symmetrische, saubere numerische Daten; den Median für schiefe Verteilungen oder beim Angeben eines "typischen" Werts; den Modus für kategoriale Daten.