Todo curso de fundamentos de estadística suele revisar el tema de las medidas de tendencia central. La media, moda y mediana suelen ser temas varias veces revisados a lo largo de la vida de todo estudiante de posgrado, sin embargo, rara vez nos explican cuándo se debe usar una u otra de estas medidas en nuestros análisis.
En esta entrada veremos cuándo deberíamos utilizar cada una de estas medidas estadísticas, dependiendo de las características de nuestra población de estudio.
LA MEDIA
La media aritmética o promedio, se calcula mediante la suma de todos los valores observados y dividiendo por el número de observaciones. La media es la forma más sencilla de resumir una sola variable y por lo general es la mejor medida de tendencia central para los propósitos de la inferencia estadística. Su fórmula se representa como sigue:
La fórmula se lee de la siguiente manera:
La media de una población es igual a la suma de cada uno de
los elementos estudiados, divididos entre el número total de datos.
Conveniencias:
- Su cálculo es muy sencillo y en él intervienen todos los datos.
- Su valor es único para una serie de datos dada.
- Se usa con frecuencia para comparar poblaciones, aunque es más apropiado acompañarla de
una medida de dispersión.
- Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de datos, ya que
tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio valor.
Inconveniencias:
- Es una medida que se ve muy afectada por la variación de los resultados, restandole utilidad cuando algunos datos son demasiado pequeños o muy grandes. Por ejemplo: si un alumno obtiene 2 de 10 puntos y otro 10 de 10 puntos, tendríamos que el promedio es 6 (12/2), pero ninguno de los alumnos evaluados obtuvo esta calificación.
LA MEDIANA
La mediana es el valor medio o central de un conjunto de observaciones. Para encontrar la mediana, los valores deben estar ordenados. Si el total de elementos del conjunto de datos es par, se calcula el promedio de los números centrales. Si el total de elementos es un número impar entonces se tomará el valor ubicado en el centro de la lista.
Conveniencias:
- Es menos sensible que la media a oscilaciones de los valores máximos y mínimos del conjunto de datos analizados.
- Su cálculo e identificación son muy intuitivos.
- Es mucho más representativa que la media cuando la población tiene resultados muy diversos o dispersos.
Inconveniencias:
- No se presta a cálculos algebraicos tan bien como
la media aritmética.
- No es una medida muy eficiente cuando los datos están agrupados en intervalos.
LA MODA
La moda es la incidencia más comúnmente encontrada en un conjunto de datos, es útil cuando se necesita conocer el material más común, característica o valor de un conjunto de datos. Es posible encontrar más de una moda en un conjunto de datos.
Conveniencias:
- Cálculo sencillo.
- Interpretación muy clara.
- Al depender sólo de las frecuencias, puede calcularse para variables cualitativas.
Inconvenientes:
- Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a
variaciones muestrales o a las agrupaciones por intervalos.
- Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera de la
moda, no afectan en modo alguno a su valor.
- No siempre se sitúa hacia el centro de la distribución.
- Puede haber más de una moda en el caso en que dos o más variables presenten
la misma frecuencia (distribuciones bimodales o multimodales).
¿CUÁNDO USAR UNA U OTRA?
- MEDIA: Cuando los resultados son muy similares y no existen máximos o mínimos muy distanciados del resto de los datos.
- MODA: Cuando en los resultados obtenidos encontramos máximos o mínimos muy distanciados del resto de los datos, pero existe uno o dos valores con una frecuencia muy alta con respecto del resto de los datos observados.
- MEDIANA: Cuando en los resultados obtenidos encontramos máximos o mínimos muy distanciados del resto de los datos.