Please enable JavaScript.
Coggle requires JavaScript to display documents.
3.1 PRESENTACIÓN DE DATOS CATEGÓRICOS - Coggle Diagram
3.1 PRESENTACIÓN DE DATOS CATEGÓRICOS
3.1.1 TABLA DE FRECUENCIA
Esta tabla indica el número de unidades de análisis que caen en cada una de
las clases de la variable cualitativa
Consideremos los casos de meningitis notificados durante el año 2000 al SI.NA.VE
(Argentina) clasificados según tipo de meningitis.
click para ver el caso
La representación gráfica de una distribución de frecuencias puede realizarse a través de un
gráfico de barras o de un gráfico de tortas.
3.1.2 GRÁFICO DE BARRAS
En un gráfico de barras, así como en cualquier tipo de gráfico se debe indicar el número total de datos ya que el gráfico sólo muestra porcentajes o frecuencias relativas y la fuente de la que se obtuvieron los mismos.
PRESIONE AQUI PARA VER EJEMPLO DE LA MENINGITIS
Es útil para representar datos categóricos nominales u ordinales. A cada categoría o clase de la variable se le asocia una barra cuya altura representa la frecuencia o la frecuencia relativa de esa clase. Las barras difieren sólo en altura, no en ancho.
3.1.3 GRÁFICO DE TORTAS
click para ver el caso de representación por grafico de torta del caso de la meningitis
¿Cuál preferir: gráfico de barras o de tortas?
sin embargo, el gráfico de barras resulta más natural para comparar las distribuciones de dos grupos, debido a que nuestro ojo percibe mejor diferencias en longitudes que en ángulos.
se representa la frecuencia relativa de cada categoría como una porción de un círculo, en la que el ángulo se correponde con la frecuencia relativa correspondiente
3.2 REPRESENTACIÓN GRÁFICA DE UN ÚNICO CONJUNTO DE
DATOS NUMÉRICOS
3.2.1 GRÁFICO DE TALLOS Y HOJAS (STEM AND LEAF)
Esta técnica gráfica desarrollada por Tukey es muy sencilla y permite mostrar la forma de
la distribución de una variable numérica.
Comenzaremos representando el conjunto de datos más simple posible: un único grupo de
números
Para visualizar mejor el caso hagamos click aquí (Tasas de neumonia)
Separamos cada observación en dos porciones, TALLO y HOJA. En general, el tallo
tendrá tantos dígitos como sea necesario, pero las hojas contendrán un único dígito.
Se listan los tallos verticalmente en orden creciente y se traza una línea vertical a la
derecha de los tallos.
A continuación de cada tallo se agregan las hojas correspondientes en la misma línea,
arreglándolas de menor a mayor.
Para más información que brindan los tallos click aquí
Gráfico de tallo-hojas espalda con espalda. Comparación de grupos.
A continuación se muestra un gráfico de la presión arterial sistólica a los 30 minutos de comenzada la anestesia en pacientes sometidos a dos técnicas anestésicas diferentes a las que nos referiremos como T1 y T2.
Click para ver la figura 5.
Los gráficos de tallo-hojas son útiles para comparar la distribución de una variable en dos condiciones o grupos. El gráfico se denomina tallo-hojas espalda con espalda porque ambos grupos comparten los tallos
3.2.2 HISTOGRAMA
Una virtud del gráfico de tallo-hojas es que retiene los valores de las observaciones, sin embargo, esta característica puede ser una desventaja para gran cantidad de datos.
Construir manualmente un histograma es más laborioso que construir un gráfico de tallohojas, pero la mayoría de los paquetes estadísticos producen histogramas.
Para construir un histograma es necesario previamente construir una tabla de frecuencias
Las clases o intervalos de clase de una tabla de frecuencias deben ser mutuamente excluyentes y exhaustivas, es decir, cada dato debe caer en una y sólo una clase y todos los datos deben tener una clase a la cual pertenecen.
Click para saber: ¿Cómo construimos una tabla de frecuencias?
Tabla de frecuencia para datos numéricos.
A partir de una variable numérica es posible construir una distribución de frecuencias
clasificando los datos en clases o categorías definidas por el investigador.
Notación, click aquí
Notación: El intervalo [0, 1) indica el conjunto de números reales entre 0 y 1, inluye el 0 y excluye el 1.
Construcción del histograma
¿Cuántas clases usar?
La decisión, tal como ocurre en el gráfico de tallo-hojas, es una solución de compromiso.
En general entre 6 y 15 clases resulta ser una buena elección.
¿Cómo describimos la forma de una distribución?
Click para ver la figura.
¿Qué características observamos en los gráficos anteriores?
La distribución es asimétrica, con mayor concentración de datos en tasas bajas y
algunas provincias con tasas altas.
Indicamos en el eje horizontal los límites de los intervalos de clase. Asociamos a cada clase una columna cuya base cubre el intervalo de clase y cuya altura indica cuantos datos “caen” en une intervalo a través de la frecuencia o la frecuencia relativa de la clase.
En el histograma de la izquierda observamos un único pico (o moda) pero en el de la derecha aparenta haber dos. Es importante remarcar que características del gráfico que no se mantienen al modificar levemente la definición de los intervalos de clase pueden ser consideradas como artificiales
b) Intervalos de clase de diferente longitud.
Cuando (erróneamente) se construye un histograma considerando como altura de la barra la frecuencia relativa se obtiene la gráfica siguiente. La última categoría de edad se truncó arbitrariamente en 80 años para poder representarla.
Los datos de la Tabla 5 presentan los casos de rubéola notificados al SI.NA.VE durante el año 2000 según grupos de edad. Notemos que los intervalos de edad tienen diferente longitud.
click aquí para ver la tabla 5
El problema es que en la imagen visual asociamos la frecuencia de casos con el área de la barra, por ello parece haber mas notificaciones de gente de 15 a 50 que de cualquier otro grupo de edad.
¿Cómo construimos el histograma teniendo en cuenta que los intervalos de clase son de
distinta longitud?
CLICK PARA VER LAS INDICACIONES
a) Intervalos de clase todos de la misma longitud. Se trazan dos ejes de coordenadas rectangulares. En el eje horizontal se representan los valores de la variable y en el eje vertical una medida de frecuencia (frecuencia absoluta, frecuencia relativa o frecuencia relativa porcentual.
Indicamos en el eje horizontal los límites de los intervalos de clase. Asociamos a cada clase una columna cuya base cubre el intervalo de clase y cuya altura indica cuantos datos “caen” en une intervalo a través de la frecuencia o la frecuencia relativa de la clase.
El gráfico se construye sin dejar espacio horizontal entre categorías, a menos que una clase
esté vacía (es decir tenga altura cero).
FIGURA6, click here!
3.2.3 POLÍGONO DE FRECUENCIAS
Figura 10. Casos notificados de rubéola. Argentina, 1999 y 2000. Fuente: SINAVE
click para ver a detalle la figura 10
El polígono de frecuencias es similar al histograma en muchos aspectos, pero pretende dar
una imagen aproximada de la “curva” definida por la distribución de la variable.
Para cosntruirlo se usan los mismos ejes que en el histograma. Se indica en la escala horizontal el punto medio de cada intervalo y en la escala vertical la escala densidad para ese intervalo, esto define pares (x, y) en el gráfico que se unen con tramos de líneas rectas.
Se marcan además los puntos medios del intervalo que precede al primero y del que sigue
al último
Click para ver la figura 9 a detalle
Comentario.
El histograma o el polígono de frecuencias muestran la distribución de edad de los casos de rubéola notificados durante un año, es decir, muestran la proporción del total de los casos que cae en cada categoría de edad.
Pero, los distintos grupos de edad tienen distinta composición, por lo tanto, puede ser de interés presentar la tasa de casos de rubéola en cada grupos de edad.
Podemos representar las tasas de rubéola cada 1000 habitantes usando:
un gráfico de barras o
un gráfico en el que cada tasa se representa como un punto ubicado en el punto medio de la categoría de edad respetando de este modo la “distancia” entre las categorías.
Click para ver la figura11