Estadística Descriptiva
La estadística descriptiva es la rama de la estadística que recolecta, analiza y caracteriza un conjunto de datos (peso de la población, beneficios diarios de una empresa, temperatura mensual,…) con el objetivo de describir las características y comportamientos de este conjunto mediante medidas de resumen, tablas o gráficos.
Variables Estadísticas
Una variable estadística es el conjunto de valores que puede tomar cierta característica de la población sobre la que se realiza el estudio estadístico y sobre la que es posible su medición.Las variables estadísticas se pueden clasificar por diferentes criterios. Según su medición existen dos tipos de variables:
2) Cuantitativas (o numérica):
Son las variables que toman valores numéricos.
Ejemplos:
Número de casas (1, 2,…). Discreta.
Edad (12,5; 24,3; 35;…). Continua.
1) Cualitativa (o categórica):
son las variables que pueden tomar como valores cualidades o categorías.
Ejemplos:
Sexo (hombre, mujer)
Salud (buena, regular, mala)
Medidas de Resumen
1. Medidas de tendencia central
Las medidas de tendencia central (o de centralización) son medidas que tienden a localizar en qué punto se encuentra la parte central de un conjunto ordenado de datos de una variable cuantitativa.
2) Mediana: La mediana (Me(X)) es el elemento de un conjunto de datos ordenados (X1,X2,…,XN) que deja a izquierda y derecha la mitad de valores.
1) Media: Definimos media (también llamada promedio o media aritmética) de un conjunto de datos (X1,X2,…,XN) al valor característico de una serie de datos resultado de la suma de todas las observaciones dividido por el número total de datos.
3) Moda: La moda (Mo(X)) es el valor más repetido del conjunto de datos, es decir, el valor cuya frecuencia relativa es mayor. En un conjunto puede haber más de una moda.
Juan Manuel Joya Bermúdez // Septiembre/5/20 // 2060647
4) Media Geométrica: La media geométrica (MG) de un conjunto de números estrictamente positivos (X1, X2,…,XN). Todos los elementos del conjunto tienen que ser mayores que cero. Si algún elemento fuese cero (Xi=0), entonces la MG sería 0 aunque todos los demás valores estuviesen alejados del cero.
2. Medidas de Dispersión
1) Rango: Rango Es el recorrido estadístico que diferencia el valor máximo y el valor mínimo en un grupo de números aleatorios. El cual ordenamos los números según su tamaño, y restamos el valor mínimo del valor máximo.
2) La Desviación Estándar: Es la medida de dispersión más común, que indica qué tan dispersos están los datos con respecto a la media. Mientras mayor sea la desviación estándar, mayor será la dispersión de los datos.
3) La Varianza: Es una medida de dispersión que representa la variabilidad de una serie de datos respecto a su media. Formalmente se calcula como la suma de los residuos al cuadrado divididos entre el total de observaciones. También se puede calcular como la desviación típica al cuadrado.
3. Medidas de Ubicación:
1) Los Cuartiles: Son valores que dividen una muestra de datos en cuatro partes iguales. Utilizando cuartiles puede evaluar rápidamente la dispersión y la tendencia central de un conjunto de datos, que son los pasos iniciales importantes para comprender sus datos.
2) Los Quintil: es la quinta parte de una población estadística, representa el 20% del número total de individuos de una población determinada. Es un termino muy utilizado en economía para distribuir a la población.
3) Los Deciles: En estadística descriptiva, un decil es cualquiera de los nueve valores que dividen a un grupo de datos ordenados en diez partes iguales, de manera que cada parte representa 1/10 de la muestra o población
4) Los Percentiles: Es una medida de posición usada en estadística que indica, una vez ordenados los datos de menor a mayor, el valor de la variable por debajo del cual se encuentra un porcentaje dado de observaciones en un grupo.
Tabulación
Gráficas o Diagramas
1. Tablas de Contingencia
Para analizar la relación de dependencia o independencia entre dos variables cualitativas nominales o factores, es necesario estudiar su distribución conjunta o tabla de contingencia. La tabla de contingencia es una tabla de doble entrada, donde en cada casilla figurará el número de casos o individuos que poseen un nivel de uno de los factores o características analizadas y otro nivel del otro factor analizado.
2.Tablas de Frecuencias
La tabla de frecuencias (o distribución de frecuencias) es una tabla que muestra la distribución de los datos mediante sus frecuencias. Se utiliza para variables cuantitativas o cualitativas ordinales.
La tabla de frecuencias es una herramienta que permite ordenar los datos de manera que se presentan numéricamente las características de la distribución de un conjunto de datos o muestra.
1) Frecuencia Absoluta:
La frecuencia absoluta (ni) de un valor Xi es el número de veces que el valor está en el conjunto (X1, X2,…, XN).
2) Frecuencia Relativa:
La frecuencia relativa (fi) de un valor Xi es la proporción de valores iguales a Xi en el conjunto de datos (X1, X2,…, XN). Es decir, la frecuencia relativa es la frecuencia absoluta dividida por el número total de elementos N
1.1) Frecuencia Absoluta Acumulada:
La frecuencia absoluta acumulada(Ni) de un valor Xi del conjunto (X1, X2,…, XN) es la suma de las frecuencias absolutas de los valores menores o iguales a Xi
2.2) Frecuencia Relativa Acumulada:
Definimos la frecuencia relativa acumulada (Fi) de un valor Xi como la proporción de valores iguales o menores a Xi en el conjunto de datos (X1, X2,…, XN). Es decir, la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividida por el número total de sujetos N
3. Gráfica de Puntos:
Los gráficos de puntos son útiles para mostrar datos cuantitativos de una forma organizada. Los gráficos de puntos usan varios puntos para trazar datos a lo largo de un eje ordinal. Un gráfico de puntos es similar a un gráfico de líneas, pero sin las líneas.
1. Gráfica de Lineas:
Los gráficos de líneas son perfectos para mostrar tendencias a lo largo de un período de tiempo. Un ejemplo estándar puede ser la forma en que se desarrolla a lo largo del tiempo un valor de una empresa determinada en el mercado de valores.
2 Grafica de Barras:
4. Gráfica Circular:
Un gráfico circular o gráfica circular, también llamado "gráfico de pastel", "gráfico de tarta", "gráfico de torta" o "gráfica de 360 grados", es un recurso estadístico que se utiliza para representar porcentajes y proporciones.
5. Gráfica de Caja:
También conocido como diagrama de caja y bigote. Es un método estandarizado para representar gráficamente una serie de datos numéricos a través de sus cuartiles.
6. Histograma:
En estadística, un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados.
Un diagrama de barras, también conocido como gráfico de barras o gráfico de columnas, es una forma de representar gráficamente un conjunto de datos o valores mediante barras rectangulares de longitud proporcional a los valores representados.