Sobre el autor

Laura Pérez Sala

Licenciada en Veterinaria por la UAB y Master en Sanidad y Producción Porcina por la UdL. Trayectoria profesional se desarrolló desarrollado en el área del marketing de la industria del Petfood En la actualidad ejerce como consultora veterinaria de porcino en TSC.

28/04/2017

Opinión del experto

Media Vs Mediana – ¿Cuál se acerca más a la realidad de tus cerdos?

La mayoría de nosotros usamos siempre la media como herramienta fundamental. ¿Qué tal si usáramos la Mediana?

Me imagino que más de uno debe preguntarse que tenia esta mañana mi café…

Bueno, normalmente en los artículos semanales intento transmitir dudas o cuestiones que están en el campo, los trending topics del sector porcino, y está claro que la estadística no es uno de ellos, pero precisamente ayer se dio una situación que me llevó a escribir ésta entrada.

Todos los que trabajamos en el sector porcino estamos acostumbrados a manejar y calcular un montón de datos que nos proporciona el programa de gestión, y en muchas ocasiones realizamos pequeñas (o grandes) pruebas, donde manejamos infinidad de números (pesos, GMD, IC etc…)

Lo que sí es cierto, es que la mayoría de nosotros usamos siempre la media como herramienta fundamental. Media de Nacidos vivos, Media de destetados, Media de peso al nacer, media de peso al destete…..media, media, media…y ¿qué tal si usáramos la Mediana?

Éste fue el debate que tuve ayer con un ingeniero agrónomo (si, si, y yo Veterinaria, diversión asegurada), y el que me ha inspirados para hoy.

Para el que, en estos momentos, esté rebuscando en los archivos de su cerebro, “yo esto lo sabía”, un pequeño recordatorio:

La media o promedio, Se interpreta como “punto de equilibrio” o “centro de masas  del conjunto de datos. Es un cálculo muy sencillo en el que intervienen todos los datos. Consiste en el sumatorio de todos los datos dividido por el número de valores.

 

La mediana, en cambio, es un valor de la variable que deja por debajo de sí a la mitad de los datos, y por encima, la otra mitad.( una vez que estos están ordenados de menor a mayor). Se sitúa, por lo tanto, en la mitad real de los datos.

Es mucho más difícil de calcular:

Con un ejemplo se entiende muchísimo mejor.

Imaginaos una empresa en la que la mayoría de los trabajadores tienen un sueldo de 1000 euros, excepto 2 encargados que cobran 2000 y el jefe que cobra 6000 euros mensuales.

¿Cuál es el salario medio de la empresa?

Si vemos la media sale casi 2000 euros, si miramos la mediana, nos da 1000.

¿Cuál se aproxima más a la realidad?

Cuando los datos son muy homogéneos la media nos da un valor representativo de la realidad, pero cuando los datos son muy heterogéneos no.

Un ejemplo más cercano a nosotros

Queremos saber el peso de los lechones a destete. Imaginemos que la camada A tiene los siguientes pesos:  (4-3-5-4.5-6.1-5-3-5.1-6.4-6-6.5-5.5-4.9)

Media: 5

Mediana: 5

Como la distribución de los valores es normal, la media y la mediana, coinciden

Ahora, en la misma granja, imaginemos una camada B (1.9-2.3-3.9-3.8-2.9-3.8-3.8-3.95-4.1-4-8.75-10.8-11)

Media: 5

Mediana: 3,9

 

En este caso la Media y la Mediana ya no se parecen en nada.

Esto sucede porque hay valores muy extremos, lechones que apenas alcanzan los 2 kg y los tres últimos que superan los 9.

¿Qué se acerca más a la realidad, la media o la mediana?

En la camada B, donde los valores son muy dispares, la mediana se acerca más a la realidad. Tengo una mayoría de lechones pequeños y 3 muy grandes.

¿Con qué camada os quedaríais vosotros?

Si yo os hago elegir tan solo por la media, os quedaríais con cualquiera de las dos, ya que las dos camadas tienen una media de peso a destete exactamente igual. ¿Pero verdad que cambiaríais de opinión si os dijera la mediana?

Situaciones en las que deberíamos escoger la Mediana:

La primera, cuando los datos no se ajustan a una distribución normal es más correcto utilizar la mediana. Esto es así­ porque la mediana es mucho más robusta, lo que quiere decir que se afecta menos por la presencia de sesgos en la distribución o de valores extremos.

La segunda tiene que ver con lo anterior. Cuando haya valores muy extremos la mediana informará mejor del punto central de la distribución que la media, que tiene el defecto de desviarse hacia los valores extremos, tanto más cuanto más extremos son.

Por último, algunos dicen que con algunas variables tiene más sentido utilizar mediana que media. Por ejemplo, si hablamos de supervivencia, la mediana nos informa sobre el tiempo de supervivencia, pero también sobre cuánto sobrevive la mitad de la muestra, por lo que serí­a más informativa que la media aritmética.

Y entonces, ¿ya no usamos nunca más la media?

  • De todas las medidas de tendencia central, la media es considerada la mejor y más útil (siempre y cuando la distribución sea normal)
  • Su cálculo es muy sencillo y en él intervienen todos los datos

Si a todos los valores de la variable se le suma una misma cantidad, la media aritmética queda aumentada en dicha cantidad.

Si todos los valores de la variable se multiplican por una misma constante la media aritmética queda multiplicada por dicha constante:

  • La media es el centro de gravedad de la distribución de la variable.
  • La media del producto de una constante a por una variable X es igual al producto de la constante por la media de la variable dada. Es decir, si se efectúa un cambio de unidad de medida a los datos (por ejemplo de kg a g), la media queda afectada por dicho cambio de escala.
  • La media de la suma de una constante entera a con una variable X es igual a la suma de la constante con la media de la variable dada. O sea, al efectuar un cambio en el origen desde el que se han medido los datos, la media queda afectada por dicho cambio de origen.
  • La media no tiene por qué ser igual a uno de los valores de los datos, ni siquiera de su misma naturaleza: datos enteros pueden tener una media decimal.

 

En definitiva, ¿media o mediana?

Mi consejo es que ante valores de distribución normal podéis seguir usando la media con tranquilidad, pero si la muestra tiene una distribución heterogénea, no.

¿Y si no sabemos si es homogénea o no?

En este caso es una buena práctica mirar ambas medidas (la mediana la encontraréis en las fórmulas estadísticas de excel), si coinciden quiere decir que la muestra es homogénea, si no coinciden, la Mediana será más representativa de la realidad muestral

1 comentario

Dejar un comentario