Cálculo de medidas para datos agrupados en intervalos
Cálculo de medidas para datos agrupados en intervalos

Antes de explicar cómo calcularlos conviene tener en cuenta  la siguiente idea:

Cuando se nos proporciona una tabla de datos agrupados por intervalos desconocemos los verdaderos valores que toma la variable. Para el cálculo de las medidas  de centralización se considera que los valores están uniformemente distribuidos en los intervalos. Lo mismo ocurre si agrupamos unos datos conocidos en intervalos. Al hacerlo nos olvidamos de sus valores verdaderos y consideraremos las aproximaciones de los mismos que supone dicha consideración de distribución uniforme en los intervalos.

Este hecho puede provocar variaciones en las medidas de centralización al considerar unos datos conocidos sin agrupar o agrupados por intervalos.  En general no será muy grande, salvo que exista una tendencia a un comportamiento sesgado en los valores.   

 

Para las medias y la moda sólo cambia el que se toma como valor representativo del intervalo su marca de clase o punto intermedio.

 

Para calcular la mediana podemos utilizar las  frecuencias absolutas o las relativas. Utilizando las frecuencias absolutas, la mediana se ubica en el intervalo donde dicha frecuencia absoluta alcance el valor N/2,  sea  Ii = [ai, ai+1), en dicho intervalo está el valor central buscado. Recordemos que hemos convenido en tomar los intervalos abiertos por la derecha. Utilizando las frecuencias absolutas, la fórmula para calcular la mediana sería

Mediana= N 2 n a i1 n i d i + a i

Es decir, la mediana sería el valor que resulta del siguiente conjunto de operaciones:

 

Dividir el número de datos N entre 2, y a ese resultado restarle la frecuencia absoluta acumulada  hasta el intervalo anterior,  nai-1

Dividir ese resultado por la frecuencia absoluta del intervalo,  ni

Multiplicar ese resultado por la amplitud del intervalo que contiene al dato central, di  = ai+1 - ai

Sumarle a la cantidad así obtenida el valor que toma el límite inferior del intervalo ai.

 

Veamos un ejemplo de este cálculo con la ayuda de Excel. Supongamos las notas del ejemplo 1 como valores de una variable estadística continua susceptible de tomar valores entre 0 y 10; y  consideramos los 5 intervalos siguientes

 

Intervalos

[0,2)

[2,4)

[4,6)

[6,8)

[8,10]

Marcas de clase

1

3

5

7

9

En el ejemplo anterior se muestra los dos modos de calcular la mediana, utilizando frecuencias absolutas y relativas.