Please enable JavaScript.
Coggle requires JavaScript to display documents.
las medidas estadísticas univariantes (medidas de dispersion (Las medidas…
las medidas estadísticas univariantes
medidas de dispersion
Las medidas de dispersión son parámetros estadísticos que nos informan sobre la variabilidad de los datos, es decir, si la distribución de los datos es más o menos homogénea y por tanto nos dan una medida sobre la representatividad de los parámetros de centralización (moda, mediana o media)
Como en los parámetros de centralización y de posición existen varios para medir la dispersión. Los principales son:
RANGO O RECORRIDO
Es la diferencia entre el mayor valor de los datos y el menor.
Re = Max {xi} - Min {xi}
La principal ventaja del rango es su fácil cálculo aunque su valor es poco significativo, ya que sólo tiene en cuenta los dos valores extremos.
RANGO O RECORRIDO INTERCUATÍLICO
Es la diferencia entre el tercer cuartil y el primero, el rango donde se encuentra el 50% central de los datos.
RI = Q3 – Q.
En ocasiones también se suele usar como valor la mitad del rango intercuartílico, hablando en esta caso de recorrido semi-intercuartil.
Estas dos primeras medidas de dispersión se suelen utilizar cuando el cálculo de la media no es posible o ésta no es significativa (ver medidas de centralización).
Las siguientes medidas que vamos a analizar se basan en medir la diferencia de los datos con la media.
DESVIACIÓN MEDIA
La desviación media es la media de la distancia de los valores de los datos (en valor absoluto) a la media. El uso del valor absoluto es para evitar que se anulen distancias negativas con distancias positivas, lo que daría como resultado que la desviación media sea cero para cualquier distribución de datos.
VARIANZA Como hemos referido antes para evitar que se anulen diferencias positivas y negativas, en al desviación media se toma valor absoluto. Dado que la función valor absoluto no tiene unas buenas propiedades matemáticas (por ejemplo, no es derivable) otra manera de transformar los valores negativos en positivos es elevando al cuadrado.
Por tanto, la varianza va a ser la media del cuadrado de la distancia de los valores de los datos a la media.
Para el cálculo se suele aplicar la expresión:
DESVIACIÓN TÍPICA
Definimos la desviación típica como la raíz cuadrada de la varianza.
o, usando la otra expresión:
El hecho de realizar la raíz cuadrada tiene por objetivo que la medida de dispersión esté expresada en la misma unidad que la variable.
MEDIDAS DE CONCENTRACION
La concentración de una distribución hace referencia al mayor o menor grado de igualdad en el reparto del total de los valores de una variable. Las medidas de dispersión son indicadores del grado de equidistribución de la variable y tienen por tanto interés cuando tratamos con variables económicas como las rentas o los salarios.
.La concentración mínima
o equidistribución, que se produce cuando todos los individuos perciben exactamente la misma cantidad:
La concentración máxima
que se produce cuando en un reparto un único individuo percibe el total de la cantidad a repatir y el resto no perciben nada:
MEDIDAS DE POSICIÓN
Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos. Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor. La medidas de posición son:
Los percentiles
son los 99 valores que dividen la serie de datos en 100 partes iguales.Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos. P50 coincide con la mediana.
Los cuartiles
son los tres valores de la variable que dividen a un conjunto de datos ordenadosen cuatro partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.Q2 coincide con la mediana.
Los deciles
son los nueve valores que dividen la serie de datos en diez partes iguales.Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.D5 coincide con la mediana
MEDIDAS DE FORMA
medidas de forma permiten comprobar si una distribución de frecuencia tiene características especiales como simetría, asimetría, nivel de concentración de datos y nivel de apuntamiento que la clasifiquen en un tipo particular de distribución.
Medida de asimetria: teoría de la probabilidad y estadística, la medida de asimetría más utilizada parte del uso del tercer momento estándar. ... Si , la distribución es asimétrica positiva o a la derecha. Si , la distribución es asimétrica negativa o a la izquierda.
Medida de apuntamiento: es una medida estadística, que determina el grado de concentración que presentan los valores de una variable alrededor de la zona central de la distribución de frecuencias.