Please enable JavaScript.
Coggle requires JavaScript to display documents.
Estadística descriptiva - Coggle Diagram
Estadística descriptiva
Tendencia central
Valores ubicados normalmente en la parte central de un conjunto de datos.
Moda
Es el dato que se repite con mayor frecuencia del grupo de datos. Es poco usada porque puede ocurrir que no existe o en otros casos no es un valor único.
Para calcularlo se realiza una tabla solo con el dato y la frecuencia. El mayor será la moda.
Para su interpretación, si es un valor único se dice que la distribución es unimodal; de lo contrario, se puede decir que es bimodal, trimodal, etc.
Media aritmética o promedio
Es la medida más utilizada para describir un conjunto de datos
Esta medida se obtiene sacando el promedio de la distribución de datos y se interpreta como el valor que representa de manera general a nuestro problema
Esta nos permite identificar el punto de equilibrio entre nuestros datos
Mediana
Es el número central en la distribución de un conjunto de x números
Para encontrarlo hay dos casos
Si el conjunto de datos es impar, la mediana siempre será el valor central
Si el conjunto de datos es par, la mediana se obtiene sacando un promedio de los dos valores centrales
Nos permite encontrar dos interpretaciones: el 50% de los datos es mayor a y/o su contraparte, el 50% de los datos es menor a. Esto nos ayuda para establecer una dicotomía sencilla entre nuestros valores.
Dispersión
Revelan la variabilidad o dispersión de un conjunto de datos respecto a una medida central.
Desviación estandar
Medida de la dispersión de una distribución de frecuencias respecto de su media.
Equivale a la raíz cuadrada de la varianza.
Para su interpretación puede ser para la población o para la muestra.
sigma mayuscula
si es para población o
sigma minuscula
si corresponde a la muestra.
Esta nos ayuda para corroborar investigaciones pues es la más estable de todas las medidas y se utilizan todos los desvíos respecto a la media.
Varianza
Medida de la variación de una serie de observaciones respecto a la media.
Se puede calcular e interpretar tanto para la muestra como para la población. Su interpretación consiste en revelar que tan dispersos están los datos alrededor de su media.
Fórmulas
Coeficiente de variación
Equivale a la desviación típica expresada en porcentaje respecto a la media.
Para obtenerlo dividimos la desviación típica entre la media aritmética.
Rango
Es la primera medida a estudiar.
Se define como la diferencia que existe entre el valor mayor y el menor de nuestro grupo de datos.
Para obtenerlo se resta al dato mayor, el menor.
Forma
Describen la forma de nuestro conjunto de datos
Sesgo
Grado o falta de asimetría en una curva de distribución de frecuencias. Se obtiene analizando el histograma.
Para su interpretación se puede hacer por tres métodos (Gráfico, relación entre media, mediana y moda y coeficiente de sesgo).
Sesgada a la derecha: extremo más largo a la derecha respecto a la máxima.
Sesgada a la izquierda: extremo más largo a la izquierda.
Coeficiente de sesgo de Pearson
Se calcula con:
3 (media - mediana) / desviación estándar
Para una distribución asimétrica, el coeficiente será 0.
Un coeficiente negativo indica sesgo a la izquierda y uno positivo sesgo a la derecha.
Curtosis
Es el grado de apuntamiento de una distribución.
Interpretación
Leptocúrtica: si la curva tiene apuntamiento relativo alto.
Platicútica: si la curva es achatada.
Mesocúrtica: ni muy puntiaguada ni muy achatada.
Se puede obtener por método gráfico o por coeficiente de Curtosis.
Coeficiente de Curtosis
Posición
Muestran la ubicación de un dato específico dentro de la distribución de datos.
Cuartiles
Valores que dividen a una muestra de datos en cuatro partes iguales.
Con los cuartiles se puede evaluar rápidamente la dispersión y la tendencia central.
Interpretación
1er cuartil (Q1): "25% de los datos es menor que o igual que..."
2do cuartil o mediana (Q2): "50% de los datos es menor que o igual a..."
3er cuartil (Q3-Q1): "50% de los datos centrales".
Fórmula
Deciles
Números o valores que dividen a los datos en diez partes. Cada conjunto de datos tiene 9 deciles.
Interpretación
D1: "a lo más una décima parte (10%) tiene valores menores y nueve décimas partes (90%) un valor mayor"
D5 es la mediana.
D9: "a lo más una décima parte (10%) tiene valores mayores y nueve décimas partes (90%) un valor menor"
Fórmula
Centiles
Números o valores que dividen a los datos en cien partes.
Fórmula
Interpretación
P1: "más una centésimas partes de los datos ( 1 % ) tienen un valor más pequeño que P1 y a lo más noventa y nueve centésimas partes ( 99% ) tiene un valor mayor.
P50 es la media.