Los histogramas son gráficos que indican la frecuencia de un hecho mediante una distribución de los datos. Los histogramas no se pueden elaborar con atributos, sino con variables medibles tales como peso, temperatura, tiempo, etc.
En definitiva un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están agrupados los datos.
En un histograma los datos se muestran en una serie de rectángulos de igual ancho y altura variable. El ancho representa un intervalo dentro del rango de los datos. La altura representa la cantidad de veces que aparece un valor dentro de ese intervalo. El patrón de alturas variables muestra la distribución de valores de datos.
¿Para qué se utilizan?
Se utiliza cuando se estudia una variable continua, como franjas de edades o altura la muestra y, por comodidad, sus valores se agrupan en clases, es decir valores continuos. En los casos en los que los datos son cualitativos (no numéricos) , como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores.
Si aplica a todos aquellos estudios en los que es necesario analizar la pauta de comportamiento de un determinado fenómeno en función de su frecuencia de aparición. Por su naturaleza gráfica, el histograma puede ayudar a identificar e interpretar pautas que son difíciles de ver son una simple tabla de números y que son de poco valor si no aparecen suficientemente ordenados y clasificados.
Permite resumir grandes cantidades de datos y comunicar información clara y sencilla sobre situaciones complejas. Se usa como herramienta de trabajo tanto para procesos industriales como dentro de las actividades habituales de gestión.
Permite:
a) Mostrar el patrón de variación.
b) Comunicar información visual del comportamiento del proceso.
c) Tomar decisiones acerca del punto en que se deben concentrar lo esfuerzos para lograr la mejora.
Tipos de histogramas
Diagramas de barras simples
Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra la cual es proporcional a la frecuencia simple de la categoría que representa.
Diagramas de barras compuestas o estrificadas.
Se usa para representar la información de una tabla de doble entrada o sea a partir de dos variables las cuales se representan así: la altura de la barra representa la frecuencia simple de las modalidades o categorías de la variable y esta altura es proporcional a la frecuencia simple de cada modalidad.
Diagrama de barras agrupadas
Se usa para representar la información de una tabla de doble entrada o sea a partir de dos variables, el cual es representado mediante un conjunto de barras como se clasifican respecto a las diferentes modalidades.
Dirigido
Otra forma muy frecuenta de representar dos histogramas de la misma variable dos situaciones distintas.
Polígono de frecuencias
Es un gráfico de líneas de las frecuencias absolutas de los valores de una distribución en el cual la altura del punto asociado a un valor de las variables es proporcional a la frecuencia de dicho valor.
Ojiva porcentual
Es un gráfico acumulativo el cual es muy útil cuando se quiere representar el rango porcentual de cada valor en una distribución de frecuencias.
Método y ejercicio resuelto
Lo primero que se tiene que poner en cuenta es que los datos se deben agrupar en clases de igual tamaño. Teniendo en cuenta lo anterior, desarrollamos las ideas básicas de la agrupación de los datos.
Para los datos que se refieren a tiempos de atención al cliente estos varían de 141 a 233 segundos. Si esto lo representáramos en una recta, la longitud seria de 92. A este valor de 92 se le conoce como rango y como puedes ver es igual a la diferencia entre el valor mayor y el valor menor , lo podemos expresar de la siguiente manera:
Supongamos que deseamos clasificar los datos en 2 clases, lo que equivaldría a dividir la recta en dos partes iguales; es decir, dividir 92/2=46. A este valor 46 se le conoce como amplitud o intervalo de clase. Entonces la primera clase comprendería los primeros tiempos entre 141 y 187 y la segunda los tiempos entre 187 y 233, como se ve en la siguiente figura.
Ahora se nos ocurre clasificar los datos en cuatro clases, es decir, tenemos que dividir el rango entre 94/4=23 entonces la primera clase comprenderá los tiempos entre 141 y 164 la segunda los tiempos entre 141 y 187, la tercera en 187 y 210 y la cuarta entre 210y 233.
Como puedes observar la amplitud de la clase se obtiene dividiendo el rango entre el número de clases deseadas, entonces tenemos que:
¿Cuántas clases? Sugerencia 2
Sugerencia 3 regla de Sturges:
La regla de Sturges es un método empírico muy utilizado en la estadística descriptiva para determinar el número de clases que deben existir en un histograma de frecuencias, para así poder clasificar un conjunto de datos que representa una muestra de población.
Básicamente, con esta regla se determina el ancho de los contenedores gráficos de los histogramas de frecuencias.
Para establecer su regla Herbert Sturges consideró un diagrama de frecuencia ideal, que consta de K intervalos, donde el i-ésimo intervalo contiene un determinado número de muestras (i=o,... k - 1), representado como:
Ese número de muestras es dado por por el número de formas que puede extraerse un subconjunto de un conjunto; es decir el coeficiente binomial, expresado de la siguiente manera:
Para simplificar la expresión, aplicó las propiedades de los logaritmos en ambas partes de la ecuación:
Así, Stuges estableció que el número optimo de intervalos k es dado por la expresión:
También puede ser expresado como:
En esta expresión
K es el número de clases.
N es el número total de observaciones de la muestra.
Log es el logaritmo común de base 10.
Por ejemplo, para elaborar un histograma de frecuencia que exprese una muestra aleatoria de la estatura de 142 niños, el número de intervalos o clases que tendrá la distribución es:
Así la distribución será en 8 intervalos.
El número de intervalos siempre debe de estar representados por números enteros. En los casos en el que el valor sea decimal se debe de hacer una aproximación al número entero más próximo.
No hay comentarios:
Publicar un comentario