Cuando
hay muchos datos (discretos o continuos),éstos se tratan en tablas de distribución de frecuencias, donde comenzamos dividiendo la escala de
medidas o datos ordenados, en una serie de intervalos
llamados de clase, de modo que cada observación está contenida en
uno de esos intervalos.
El
nº de clases es raiz de n
. Su tamaño se obtiene de dividir el "rango",
diferencia entre el mayor y el menor valor, entre el nº de clases, de
forma que el primer extremo del intervalo contenga el menor dato y el último
extremo al dato más grande y que las clases no se superpongan. Las
clases suelen serdel mismo
tamaño, aunque en ciertas distribuciones se pueden escoger de distinto
tamaño.
Cuando
los datos son valores decimales se llaman continuos,
en contraposición a discretos
que resultan de contar, enumerar etc. sucesos.
El
punto central se llama marca
y es el representante de cada intervalo.
Cuando
los datos se tratan en clases, se hace uso de los histogramas
que consisten en una serie de rectángulos de base el tamaño de las
clases y de altura las frecuencias de cada clase, aunque a veces cuando
se usan clases de distinto tamaño la frecuencia representa el área del
rectángulo. Sobre un eje horizontal se representan los extremos de cada
clase y se construyen después los rectángulos con sus alturas
correspondientes.
Los
histogramas tienen varias formas, dependiendo en parte de la moda, que
es el dato o clase que más se repite y en tenor a ello se clasifican
en: unimodal un solo pico, bimodal
dos picos, multimodal, simétrico
(coincide la moda con la media) si existe un eje que lo divide en dos
partes iguales, sesgadopositivamente si se alarga hacia la derecha, negativamente si se alarga a la izquierda etc.