- Educación
- Matemáticas
- Estadísticas
- Cómo agrupar datos estadísticos adecuadamente en un histograma
Libro Relacionado
Por Deborah J. Rumsey
Al crear un histograma, es importante agrupar los conjuntos de datos en rangos que le permitan ver patrones significativos en sus datos estadísticos. Por ejemplo, digamos que usted quiere ver si las actrices que han ganado un Premio de la Academia tienen probabilidades de estar dentro de un cierto rango de edad.
La siguiente imagen muestra un histograma de las edades de los ganadores de los premios Oscar a la mejor actriz entre 1928 y 2009.
Esta imagen muestra grupos de 5 años cada uno porque los incrementos de 5 años crean roturas naturales durante años y porque proporciona suficientes barras para buscar patrones generales. Por ejemplo, se puede ver que la mayoría de los ganadores, alrededor del 68 por ciento, tenían entre 25 y 40 años de edad, con un aumento definitivo entre los 30 y 35 años.
Tenga en cuenta que no tiene que usar esta agrupación en particular; tiene un poco de flexibilidad al hacer un histograma. Aquí hay algunos consejos útiles:
- Si un histograma tiene rangos realmente amplios para sus grupos, coloca todos los datos en un número muy pequeño de barras que imposibilitan las comparaciones significativas Si el histograma tiene rangos muy estrechos para sus grupos, parece una gran serie de pequeñas barras que nublan el panorama general. Esto puede hacer que los datos se vean muy entrecortados sin un patrón real.
- Asegúrese de que sus grupos tengan la misma anchura. Si una barra es más ancha que las otras, puede contener más datos de los que debería.
Una solución que puede ser apropiada para su histograma es tomar el rango de los datos (mayor menos menor) y dividir por 10 para obtener 10 grupos.
¿Qué pasa si un ganador tiene 30 años? ¿Pertenece al 25-30 o al 30-35? Siempre y cuando sea consistente con todos los puntos de datos, puede poner todos los puntos límite en sus respectivas barras inferiores o ponerlos todos en sus respectivas barras superiores. Lo importante es elegir una dirección y ser consistente. Es una práctica común hacer que los intervalos de barras sean a la izquierda inclusive (es decir, las barras incluyen el punto final izquierdo pero no el derecho).