jueves, 8 de octubre de 2020

Introducción



 La razón por la cual se creo este blog es para dar a conocer los distintos métodos tabulares y gráficos que hay puesto que estos métodos nos permiten organizar y presentar datos de tal manera que sean fácilmente entendibles ya que en las áreas de los negocios o las ciencias sociales es habitual que se trabaje con información organizada y resumida para interpretar el fenómeno que deseamos estudiar.

Nosotros como docentes en formación inicial de la licenciatura en Educación Primaria debemos de ver más allá de que matemáticas no es solo enseñar aritmética sino que debemos de ampliar nuestro conocimiento más allá de las operaciones aritméticas y la geometría básica como lo es la probabilidad y estadística e indagar a fondo este tema y las características que estudia.

Distribución de frecuencias

 Una distribución de frecuencias o una tabla de frecuencias no es más que la presentación tabular de las frecuencias con que ocurre cada característica (subclase) en las que ha sido dividida una variable. Esta característica puede estar determinada por una cualidad o un intervalo, por lo tanto, la construcción de un cuadro de frecuencia o tabla de frecuencias puede desarrollarse tanto en una variable cuantitativa como para una variable cualitativa.

¿Para qué se utilizan?

Se utilizan cuando se recolectan datos, con ellas se puede representar los datos de manera que es más fácil analizarlos. Se pueden elaborar tablas para datos no agrupados. Estas ultimas se utilizan  cuando se tienen muchos datos.

Método de solución 

Para elaborar tablas de frecuencia se debe tener en cuenta lo siguiente:

Cuando hay muchos datos se agrupan en clases, esto consiste en agrupar los datos en una distribución de frecuencias que pueden definirse como una ordenación o arreglo de datos en clases o en categorías que muestran para cada una de ellas el número de elementos que contiene, denominada frecuencia.

Clase es cada uno de los grupos en los que se dividen los datos. Para determinar cuantas clases crear se puede utilizar la siguiente formula (la formula de Sturges)

Si al aplicar la formula se obtiene un número decimal, se aproxima al siguiente entero.
El intervalo de clase o el ancho de clase es el espacio que hay entre el limite superior y el limite inferior de la clase los cuales corresponden a los valores extremos de las clases. Para obtener el ancho de la clase se utiliza la siguiente formula.

La frecuencia absoluta es el número de veces que se repite cada dato. Cuando se agrupan los datos, es el número de datos que se tiene cada clase simboliza con fj.
La marca de clase es el punto medio de la clase. Se obtiene dividiendo entre dos la suma de los valores extremos de cada clase.

El rango es la diferencia entre el valor mayor y el valor menor en el estudio de una distribución de datos.
La frecuencia absoluta acumulada es la frecuencia total hasta el limite superior de cada clase. Se simboliza con fi.
La frecuencia relativa de un dato da información sobre que parte de la población o de la muestra de estudio corresponde a la característica analizada. Se obtiene dividiendo la frecuencia absoluta entre el número total de datos y se puede expresar como una fracción como un decimal o como un porcentaje, se simboliza con fi/n donde n es el número de datos.

La frecuencia acumulada relativa es la frecuencia relativa total hasta el limite superior de cada clase. Se simboliza f j/ n donde n es el número total de datos.

Ejemplo:
Suponga que un investigador desea determinar como varía el peso de un grupo de estudiantes de primer semestre de una universidad. Selecciona una muestra de 50 estudiantes y registra sus pesos en kilogramos. Los datos obtenidos fueron los siguientes.
Este diagrama facilita determinar la cantidad de veces que se repite un dato y los valores de los datos con el fin de describir de manera ordenada en la tabla.
Para construir la tabla de datos no agrupados se debe calcular primero lo siguiente:

Número de clases
Rango
Amplitud de clase

Punto medio: mi es el valor central de la clase. Se obtiene calculando el promedio de los límites reales, sumando el límite real inferior, el limite real superior y dividiendo por dos.
Frecuencia absoluta: Se define como el número de elementos u observaciones pertenecientes a una misma clase.
Frecuencia relativa: Se obtiene dividiendo la frecuencia absoluta por el número total de observaciones. Indica la importancia relativa de la clase.
Frecuencias acumuladas: Es la suma de las frecuencias absolutas o relativas en sentido ascendente o descendente según se quieran acumular "hacia arriba" o "hacia abajo".
Al construir la tabla de datos agrupados con la información del ejemplo, se tiene:

















Gráfica de barras

 

Son una representación visual de los datos usando rectángulos horizontales o verticales cuyas longitudes son proporcionales a las cantidades que representa.

¿Para qué se utilizan?
Las gráficas de barras se utilizan para datos cualitativos o categóricos. Pueden utilizarse también para describir variables cuantitativas discretas que toman pocos valores. La gráfica de barras la comparación entre las diferentes categorías.

¿Cómo se construye una gráfica de barras?
Método de solución

Una gráfica de barras verticales se construye de la manera siguiente:
-Primero se dibujan los ejes X y Y.
-En el eje X se colocan las diferentes categorías o valores de los datos.
-En el eje Y se desarrolla una escala que mida la frecuencia o el valor asociado a las categorías. En el caso que se utilice para datos cuantitativos en el eje Y se puede indicar una función de los datos como la media, la proporción etc.
-Por último, se dibuja un rectángulo de ancho arbitrario para cada categoría. La altura del rectángulo debe ser proporcional a la frecuencia de la categoría o al valor asociado a ella.

Para tener una gráfica de barras horizontales se sigue el mismo procedimiento invirtiendo los ejes, es decir, en el eje de Y se colocan las diferentes categorías y en el eje X las frecuencias o valores asociados a ellas. Todas las barras deben tener el mismo ancho y no deben superponerse las unas con las otras.

La gráfica de barras verticales es la que más se usa, debido a que la diferencia entre un punto arriba y abajo tiene mayor connotación visual que la diferencia entre un punto entre la derecha y la izquierda.Cuando las barras son verticales mayor altura indica mayor frecuencia o mayor valor.


En las gráficas de barras en lugar de las proporciones del total que representan cada categoría , se muestra la comparación entre ellas. Cuando se muestran los mismos datos en dos o mas figuras se recomienda utilizar el mismo color o la misma forma de sombreado para cada nivel o categoría.

Ejercicio

A continuación se muestran los resultados de votación 2009, para elegir el ayuntamiento de Cuautitlán.

Y con los datos de esta tabla se acomodan en la gráfica.













Gráficas circulares o de pastel

 Un diagrama de pastel es un círculo dividido en partes, donde el área de cada parte es proporcional a número de datos de cada categoría.

¿Para que se utilizan? 

 Estos gráficos nos permiten ver la distribución interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Los gráficos circulares son adecuados para recalcar la magnitud relativa de componentes del total. La gráfica de pastel se usa para representar variables cualitativas o categorías de preferencia nominales.

Método para construir una gráfica de pastel

-Se debe de identificar el todo así como sus partes.

-Cada elemento estudiado debe pertenecer solo a una categoría.

-Se deben representar las proporciones para cada categoría de lo variable.

- La suma de las proporciones no debe exceder al 100%.

-Se debe de utilizar para representar máximo 5 categorías.

-Si la suma de las categorías más grandes y mas importantes suman menos de 100% entonces las otras categorías se deben de agrupar en una sola, la cual se debe de identificar con el nombre de "otras", "varios", etc.

Como regla general las graficas de pastel deben mostrar tanto, el porcentaje o proporción, como el número de elementos en cada categoría. Debido a que en la gráfica de pastel lo importante es mostrar el porcentaje o proporción que le corresponde a cada categoría y no el orden, son más adecuadas para representar variables nominales en lugar de ordinales. Si es importante mostrar el orden y la comparación  entre las categorías y la gráfica de barras es la adecuada. Cuando presente sus resultados con una gráfica de pastel y definir muy bien el todo.
En la gráfica de pastel ordenar las categorías de mayor a menor o viceversa no es conveniente. Por intuición el lector lee la gráfica de arriba hacia abajo y en el sentido de las manecillas del reloj.

Ejercicio

Se desea representa con una gráfica de pastel los datos que se muestran en la siguiente tabla, que se refieren a preferencias de un buscador de internet que usan un grupo de estudiantes.

    A la tabla se le añade la columna correspondiente a la frecuencia relativa, es decir la proporción de estudiantes que corresponde a cada categoría.

Se añade la columna de porcentajes simplemente multiplicando las frecuencias relativas o proporciones por 10.


Al fin de determinar cuantos grados le corresponden a cada categoría multiplicamos la frecuencia relativa por 360 (ya que un círculo tiene 360°).
La categoría mas importante se debe de colocar en la posición de las doce, siguiendo el sentido de las manecillas. Sobre un círculo siguiendo las recomendaciones anteriores, colocamos el punto inicial en la posición de las doce horas. A partir del punto inicial indicamos a categoría marcando google138° con la ayuda de un transportador en sentido de las manecillas de un reloj. Enseguida a partir del punto inicial marcamos 83° en sentido en sentido contrario de las manecillas, que es la proporción que le corresponde a yahoo,  a partir del punto final marcamos 83°+55°=138° que le corresponde a Msn. A partir del punto inicial marcamos83°+55°+55°=193° para señalar la proporción que le corresponde a Netscape. La proporción restante corresponde a la categoría de menor importancia que en este caso es Altavista.





Histogramas

 Los histogramas son gráficos que indican la frecuencia de un hecho mediante una distribución de los datos. Los histogramas no se pueden elaborar con atributos, sino con variables medibles tales como peso, temperatura, tiempo, etc.

En definitiva un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están agrupados los datos.

En un histograma los datos se muestran en una serie de rectángulos de igual ancho y altura variable. El ancho representa un intervalo dentro del rango de los datos. La altura representa la cantidad de veces que aparece un valor dentro de ese intervalo. El patrón de alturas variables muestra la distribución de valores de datos.



¿Para qué se utilizan?

Se utiliza cuando se estudia una variable continua, como franjas de edades o altura la muestra y, por comodidad, sus valores se agrupan en clases, es decir valores continuos. En los casos en los que los datos son cualitativos  (no numéricos) , como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores.

Si aplica a todos aquellos estudios en los que es necesario analizar la pauta de comportamiento de un determinado fenómeno en función de su frecuencia de aparición. Por su naturaleza gráfica, el histograma puede ayudar a identificar e interpretar pautas que son difíciles de ver son una simple tabla de números y que son de poco valor si no aparecen suficientemente ordenados y clasificados.

Permite resumir grandes cantidades de datos y comunicar información clara y sencilla sobre situaciones complejas. Se usa como herramienta de trabajo tanto para procesos industriales como dentro de las actividades habituales de gestión.

Permite:

a) Mostrar el patrón de variación.

b) Comunicar información visual del comportamiento del proceso.

c) Tomar decisiones acerca del punto en que se deben concentrar lo esfuerzos para lograr la mejora.

Tipos de histogramas


Diagramas de barras simples

Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra la cual es proporcional a la frecuencia simple de la categoría que representa.

Diagramas de barras compuestas o estrificadas.
Se usa para representar la información de una tabla de doble entrada o sea a partir de dos variables las cuales se representan así: la altura de la barra representa la frecuencia simple de las modalidades o categorías de la variable y esta altura es proporcional a la frecuencia simple de cada modalidad.

Diagrama de barras agrupadas
Se usa para representar la información de una tabla de doble entrada o sea a partir de dos variables, el cual es representado mediante un conjunto de barras como se clasifican respecto a las diferentes modalidades.

Dirigido
Otra forma muy frecuenta de representar dos histogramas de la misma variable dos situaciones distintas.

Polígono de frecuencias 
Es un gráfico de líneas de las frecuencias absolutas de los valores de una distribución en el cual la altura del punto asociado a un valor de las variables es proporcional a la frecuencia de dicho valor.

Ojiva porcentual
Es un gráfico acumulativo el cual es muy útil cuando se quiere representar el rango porcentual de cada valor en una distribución de frecuencias.

Método y ejercicio resuelto
Lo primero que se tiene que poner en cuenta es que los datos se deben agrupar en clases de igual tamaño. Teniendo en cuenta lo anterior, desarrollamos las ideas básicas de la agrupación de los datos.

Para los datos que se refieren a tiempos de atención al cliente estos varían de 141 a 233 segundos. Si esto lo representáramos en una recta, la longitud seria de 92. A este valor de 92 se le conoce como rango y como puedes ver es igual a la diferencia entre el valor mayor y el valor menor , lo podemos expresar de la siguiente manera:

Supongamos que deseamos clasificar los datos en 2 clases, lo que equivaldría a dividir la recta en dos partes iguales; es decir, dividir 92/2=46. A este valor 46 se le conoce como amplitud o intervalo de clase. Entonces la primera clase comprendería  los primeros tiempos entre 141 y 187 y la segunda los tiempos entre 187 y 233, como se ve en la siguiente figura.
Ahora se nos ocurre clasificar los datos en cuatro clases, es decir, tenemos que dividir el rango entre 94/4=23 entonces la primera clase comprenderá los tiempos entre 141 y 164 la segunda los tiempos entre  141 y 187, la tercera en  187 y 210 y la cuarta  entre 210y 233.
Como puedes observar la amplitud de la clase se obtiene dividiendo el rango entre el número de clases deseadas, entonces tenemos que:

¿Cuántas clases? Sugerencia 2


Sugerencia 3 regla de Sturges:
La regla de Sturges es un método empírico muy utilizado en la estadística descriptiva para determinar el número de clases que deben existir en un histograma de frecuencias, para así poder clasificar un conjunto de datos que representa una muestra de población.
Básicamente, con esta regla se determina el ancho de los contenedores gráficos de los histogramas de frecuencias.
Para establecer su regla Herbert Sturges consideró un diagrama de frecuencia ideal, que consta de K intervalos, donde el i-ésimo intervalo contiene un determinado número de muestras (i=o,... k - 1), representado como: 
Ese número de muestras es dado por por el número de formas que puede extraerse un subconjunto de un conjunto; es decir el coeficiente binomial, expresado de la siguiente manera:
Para simplificar la expresión, aplicó las propiedades de los logaritmos en ambas partes de la ecuación:
Así, Stuges estableció que el número optimo de intervalos k es dado por la expresión:
También puede ser expresado como:

En esta expresión
K es el número de clases.
N es el número total de observaciones de la muestra.
Log es el logaritmo común de base 10.

Por ejemplo, para elaborar un histograma de frecuencia que exprese una muestra aleatoria de la estatura  de 142 niños, el número de intervalos o clases que tendrá la distribución es:


Así la distribución será en 8 intervalos.
El número de intervalos siempre debe de estar representados por números enteros. En los casos en el que el valor sea decimal se debe de hacer una aproximación al número entero más próximo.






















Conclusión

 Como mencione antes, nosotros como normalistas o docentes en formación inicial  es fundamental que ampliemos al máximo nuestro conocimiento sobre los métodos tabulares y gráficos para aplicarlos en problemas educativos contextualizados y con eso lograr que los alumnos contesten sus dudas sobre los análisis cuantitativos o cualitativos que se muestran en los contenidos de primaria a través de problemas cariados como lo son los graficar.

Además, en educación primaria los gráficos estadísticos son procesos de mucha complejidad por lo que es necesario conocer el contexto de los contenidos que se van a tratar, la metodología o el procesos que se va a seguir para enseñarlo. El docente es el que debe de contemplar las distintas posibilidades que hay para la enseñanza de los gráficos estadísticos.

Referencias

 Cuautitlán, F. D. (2012) Histograma. Cuautitlán: Universidad Nacional Autónoma de México.

D'Alessio Torres Vicencio J. (2017) Regla de Sturges:  Explicación, Aplicaciones y Ejemplos.

Facultad de Estudios Superiores Cuautlán (2012). Gráfica de barras. Universidad Nacional Autónoma de México.

Facultad de Estudios Superiores Cuautlán (2012). Gráfica de Pastel. Universidad Autónoma de México.

García Mendoza, S. Altamirano, P.A., Huapaya Espinoza E., Zegarra Orosco, H., & Huerta Rosales, L. (2009). GUIA PARA LA PRESENTACIÓN DE GRÁFICOS ESTADISTICOS. Lima: Centro de Edición del INEI.

Hérnandez Granados, L (2018). Tipos de gráficas  utilizadas en estadística. Hidalgo.

Monge J. (19 de abril 2017) Distribución de frecuencias. Matemática, informática y Educación. https://jcastrom.jimdofree.com/matematica/estadistica/distribuci%C3%B3n-de-frecuencias/

Gehisy. (10 de julio 2017). Histogramas. Calidad y ADR https://aprendiendocalidadyadr.com/histogramas/