Cálculo de medidas para datos agrupados en intervalos
Antes de explicar cómo calcularlos conviene tener en cuenta la
siguiente idea:
Cuando se nos proporciona una tabla de datos agrupados por
intervalos desconocemos los verdaderos valores que toma la variable. Para el
cálculo de las medidas de centralización se considera que los valores están
uniformemente distribuidos en los intervalos. Lo mismo ocurre si agrupamos unos
datos conocidos en intervalos. Al hacerlo nos olvidamos de sus valores
verdaderos y consideraremos las aproximaciones de los mismos que supone dicha
consideración de distribución uniforme en los intervalos.
Este hecho puede provocar variaciones en las medidas de
centralización al considerar unos datos conocidos sin agrupar o agrupados por
intervalos. En general no será muy grande, salvo que exista una
tendencia a un comportamiento sesgado en los valores.
Para
las medias y la moda sólo cambia el que se toma como valor representativo
del intervalo su marca de clase o punto intermedio.
Para
calcular la mediana podemos utilizar las frecuencias absolutas o las
relativas. Utilizando las frecuencias absolutas, la mediana se ubica en
el intervalo donde dicha frecuencia absoluta alcance el valor N/2,
sea
I = [a a),
en dicho intervalo está el valor central buscado. Recordemos que
hemos convenido en tomar los intervalos abiertos por la derecha.
Utilizando las frecuencias absolutas, la fórmula para calcular la
mediana sería
Mediana=N2−nai−1nidi+ai
Es
decir, la mediana sería el valor que resulta del siguiente conjunto de
operaciones:
1º
Dividir
el número de datos N entre 2, y a ese resultado restarle la frecuencia
absoluta acumulada hasta el intervalo anterior, nai-1
2º
Dividir
ese resultado por la frecuencia absoluta del intervalo, ni
3º
Multiplicar
ese resultado por la amplitud del intervalo que contiene al dato
central, d = a- a
4º
Sumarle a la cantidad así obtenida el valor que toma el límite
inferior del intervalo a.
Veamos un
ejemplo de este cálculo con la ayuda de Excel. Supongamos las notas del ejemplo 1
como valores de una variable estadística continua susceptible de tomar
valores entre 0 y 10; y consideramos los 5 intervalos siguientes
Intervalos
[0,2)
[2,4)
[4,6)
[6,8)
[8,10]
Marcas de clase
1
3
5
7
9
En el ejemplo anterior se muestra los dos modos de calcular la mediana,
utilizando frecuencias absolutas y relativas.