La media, la mediana y la moda son tres maneras distintas de resumir "el centro" de un conjunto de datos. Elegir la incorrecta puede hacer que tu análisis sea tremendamente engañoso.
Media (promedio aritmético)
La media usa todos los puntos de datos, lo cual es su fortaleza y su debilidad. Fortaleza: minimiza la pérdida cuadrática, se lleva bien con el cálculo, subyace a la regresión / varianza / distribuciones gaussianas. Debilidad: un único valor atípico extremo puede arrastrarla lejos del grueso de los datos.
Usa la media cuando los datos sean aproximadamente simétricos y los valores atípicos sean raros o ya se hayan eliminado.
Mediana (valor central)
La mediana es la observación central tras ordenar los datos. Para ingresos, tiempo de respuesta, tamaño de archivo y otras distribuciones de cola pesada, la mediana es mucho más representativa que la media: si Bill Gates entra en un bar, sube la media de los ingresos pero apenas mueve la mediana.
Usa la mediana para datos sesgados, al informar de un valor "típico" o cuando importa la robustez.
Moda (valor más frecuente)
La moda es el valor que aparece con más frecuencia. Es útil sobre todo para datos categóricos (color favorito, tipo de navegador) donde la media y la mediana ni siquiera se aplican. Para datos numéricos continuos, a menudo la moda no existe en ningún sentido significativo: cada observación es única.
Cuál usar
| Escenario | Mejor medida |
|---|---|
| Numérico simétrico y sin valores atípicos | Media |
| Numérico sesgado (ingresos, latencia) | Mediana |
| Categórico | Moda |
| Informar de un valor "típico" a un público general | Mediana |
| Base para más cálculo / estadística | Media |
Si estás empezando con la estadística, interioriza esto: media para las matemáticas, mediana para las historias.
Pruébalas tú mismo
Pega cualquier conjunto de datos en nuestra Calculadora de media, mediana y moda y ve las tres a la vez.
At a glance
| Feature | Media | Mediana (frente a moda) |
|---|---|---|
| Afectada por valores atípicos | Mucho | Apenas |
| Funciona con datos categóricos | No | No (usa la moda) |
| Subyace a varianza / regresión | Sí | No |
| Mejor para distribuciones sesgadas | No | Sí |
Usa la media para datos numéricos simétricos y limpios; la mediana para distribuciones sesgadas o al informar de un valor "típico"; la moda para datos categóricos.