PRESENTACIÓN DE DATOS CATEGÓRICOS

TABLA DE FRECUENCIA

El modo más simple de presentar datos categóricos es por medio de una tabla de frecuencias. Esta tabla indica el número de unidades de análisis que caen en cada una de las clases de la variable cuantitativa.

GRÁFICO DE BARRAS

Este gráfico es útil para representar datos categóricos nominales u ordinales. A cada
categoría o clase de la variable se le asocia una barra cuya altura representa la frecuencia o
la frecuencia relativa de esa clase. Las barras difieren sólo en altura, no en ancho.

tabla 2

tabla 1

GRÁFICO DE TORTAS

tabla 3

En este gráfico, ampliamente utilizado, se representa la frecuencia relativa de cada categoría como una porción de un círculo, en la que el ángulo se corresponde con la frecuencia relativa correspondiente. Como en todo gráfico es importante indicar el número
total de sujetos.

¿Cuál preferir: gráfico de barras o de tortas?


La información que brindan los dos tipos de gráficos es equivalente, sin embargo, el
gráfico de barras resulta más natural para comparar las distribuciones de dos grupos, debido a que nuestro ojo percibe mejor diferencias en longitudes que en ángulos. Por otra parte, en el gráfico de barras todas las barras comienzan al mismo nivel, lo que facilita la
comparación.

REPRESENTACIÓN GRÁFICA DE UN ÚNICO CONJUNTO DE
DATOS NUMÉRICOS

Comenzaremos representando el conjunto de datos más simple posible: un único grupo de
números. Trataremos de responder a preguntas tales como:



¿Son los valores medidos casi todos iguales?


¿Son muy diferentes unos de otros?


¿En qué sentido difieren?


¿Cómo podemos describir cualquier patrón o tendencia?


¿Son un único grupo? ¿Hay varios grupos de números?


¿Difieren algunos pocos números notablemente del resto?

GRÁFICO DE TALLOS Y HOJAS (STEM AND LEAF)

Es apropiada para conjuntos de observaciones no muy extensos, se construye con poco
esfuerzo por lo que es muy simple de realizar con lápiz y papel.

tabla 4

  1. Separamos cada observación en dos porciones, TALLO y HOJA. En general, el tallo


    tendrá tantos dígitos como sea necesario, pero las hojas contendrán un único dígito.


  2. Se listan los tallos verticalmente en orden creciente y se traza una línea vertical a la


    derecha de los tallos.


  3. Se debe tomar una decisión sobre qué se hará con el dígito posterior a la hoja, i se


    truncará o se redondeará, poco se pierde truncando y esta última opción hace más


    simple volver a la lista de datos a partir del gráfico.

HISTOGRAMA

El histograma es el más conocido de los gráficos para resumir un conjunto de datos numéricos y pretende responder a las mismas preguntas que un gráfico de tallo-hojas. Una
virtud del gráfico de tallo-hojas es que retiene los valores de las observaciones, sin
embargo, esta característica puede ser una desventaja para gran cantidad de datos.

Tabla de frecuencia para datos numéricos.


Las clases o intervalos de clase de una tabla de frecuencias deben ser mutuamente
excluyentes y exhaustivas, es decir, cada dato debe caer en una y sólo una clase y todos los
datos deben tener una clase a la cual pertenecen.

¿Cómo construimos una tabla de frecuencias?


  1. Se divide el rango total de los datos en clases o intervalos, los que no necesariamente


    deben tener la misma longitud.


  2. Se cuenta el número de observaciones que cae en cada clase y se determna la


    frecuencia en cada clase.


  3. Se calculan las frecuencias relativas, frecuencias acumuladas y frecuencias


    acumuladas relativas para cada intervalo.

tabla 5

Construcción del histograma

Intervalos de clase todos de la misma longitud.



Se trazan dos ejes de coordenadas rectangulares. En el eje horizontal se representan los valores de la variable y en el eje vertical una medida de frecuencia (frecuencia absoluta,
frecuencia relativa o frecuencia relativa porcentual.

tabla 6

¿Qué características observamos en los gráficos anteriores?


  1. La distribución es asimétrica, con mayor concentración de datos en tasas bajas y


    algunas provincias con tasas altas.


  2. Se observan cuatro provincias con tasas de notificación de casos de neumonía más


    altas que el resto. Ellas son San Luis, Formosa, La Pampa y Chaco. Tal vez podríamos


    pensar en dos agrupamientos.


  3. En el histograma de la izquierda observamos un único pico (o moda) pero en el de la derecha aparenta haber dos. Es importante remarcar que características del gráfico que no se mantienen al modificar levemente la definición de los intervalos de clase pueden


    ser consideraradas como artificales.

POLÍGONO DE FRECUENCIAS

El polígono de frecuencias es similar al histograma en muchos aspectos, pero pretende dar una imagen aproximada de la “curva” definida por la distribución de la variable.

tabla 7