Please enable JavaScript.
Coggle requires JavaScript to display documents.
Características de las variables numéricas (Distribución: Que tan…
Características de las variables numéricas
Mediana
Corta en medio.La mitad de las observaciones están arriba de la línea y abajo de ella
Media
Es el promedio ordinarios,es donde el diagrama de puntos se balancea.
Se ve afectada por valores atípicos
Si la figura es aproximadamente simetrica la mediana y la media serán casi las mismas.
Si la figura está distorcionada y no hay una noción de centro la mediana y media pueden diferir.
Distribución: Que tan variables son las observaciones entre cada una de ellas
Distribución pequeña:Las observaciones son muy pequeñas o varían muy poco entre cada una de ellas
Distribución larga: Las observaciones son más variables y más diferentes entre una y otra.
Para medir la distribución utilizamos : el rango intercuartiles y las desviación estándar.
Los cuartiles cortan los datos en cuartos: el 1° cuartil,el 2° cuartil (mediana) y el 3° cuartil.El rango intercuartil es el rango de los valores abarcados en la mitad de los datos:
El rango Intercuartil se obtiene de la siguiente manera:
3° quartil -1°quartil
Desviación estándar: Es la raíz cuadrada del promedio de las distancias cuadradas entre los puntos y la media.Primero se promedian las distancias cuadradas y luego se obtiene la raíz cuadrada de éstas.
Outliers o valores atípicos: Datos que están lo suficientemente lejos
Causa:Se deben a errores, o cuestiones inesperadas..
Seguimiento: Trata de ver tus fuentes originales para saber si es real. Y trata de encontrar la causa real
Espacios y grupos
Causa:Existencia de distintos grupos
Trata de encontrarlos definiendo sus características.
Picos
Causa:Errores,Algo real e inesperado
Trata de resolver si es real o debes ir directamente a tus fuentes originales y corregirlo si es posible. Preguntate si es un problema para tu análisis?. Trata de encontrar la causa real.
Truncacaciones
Causa: Todos los valores largos se han eliminado
Preguntate si es un problema para tu análisis?
Truncaciones con pico
Causa:Todos los valores largos son puestos como valores picos
Preguntate si es un problema para tu análisis?