Compare

Media vs mediana vs moda

La media, la mediana y la moda son tres maneras distintas de resumir "el centro" de un conjunto de datos. Elegir la incorrecta puede hacer que tu análisis sea tremendamente engañoso.

Media (promedio aritmético)

xˉ=1ni=1nxi\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i

La media usa todos los puntos de datos, lo cual es su fortaleza y su debilidad. Fortaleza: minimiza la pérdida cuadrática, se lleva bien con el cálculo, subyace a la regresión / varianza / distribuciones gaussianas. Debilidad: un único valor atípico extremo puede arrastrarla lejos del grueso de los datos.

Usa la media cuando los datos sean aproximadamente simétricos y los valores atípicos sean raros o ya se hayan eliminado.

Mediana (valor central)

La mediana es la observación central tras ordenar los datos. Para ingresos, tiempo de respuesta, tamaño de archivo y otras distribuciones de cola pesada, la mediana es mucho más representativa que la media: si Bill Gates entra en un bar, sube la media de los ingresos pero apenas mueve la mediana.

Usa la mediana para datos sesgados, al informar de un valor "típico" o cuando importa la robustez.

Moda (valor más frecuente)

La moda es el valor que aparece con más frecuencia. Es útil sobre todo para datos categóricos (color favorito, tipo de navegador) donde la media y la mediana ni siquiera se aplican. Para datos numéricos continuos, a menudo la moda no existe en ningún sentido significativo: cada observación es única.

Cuál usar

EscenarioMejor medida
Numérico simétrico y sin valores atípicosMedia
Numérico sesgado (ingresos, latencia)Mediana
CategóricoModa
Informar de un valor "típico" a un público generalMediana
Base para más cálculo / estadísticaMedia

Si estás empezando con la estadística, interioriza esto: media para las matemáticas, mediana para las historias.

Pruébalas tú mismo

Pega cualquier conjunto de datos en nuestra Calculadora de media, mediana y moda y ve las tres a la vez.

At a glance

FeatureMediaMediana (frente a moda)
Afectada por valores atípicosMuchoApenas
Funciona con datos categóricosNoNo (usa la moda)
Subyace a varianza / regresiónNo
Mejor para distribuciones sesgadasNo
Verdict

Usa la media para datos numéricos simétricos y limpios; la mediana para distribuciones sesgadas o al informar de un valor "típico"; la moda para datos categóricos.