Please enable JavaScript.
Coggle requires JavaScript to display documents.
Análisis previo de datos, image, Sesión 3 Elaborado por: Diego Rivera -…
Análisis previo de datos
Valores perdidos
Diagnósticos de aleatoriedad
1.Deben ser independientes de los valores perdidos
Analizar si existe correlación entre los valores perdidos de la
variable analizadas y los valores perdidos de otras variables
Tratamiento de Valores Perdidos
Eliminación de los casos
Imputación de valores: Se puede reemplazar los datos perdidos por la media de los valores observados
Condiciones de los VPCA
Deben ser independientes del resto de valores
Deben ser independientes de los valores perdidos
Casos Atípicos o outliers
Detección univariante de casos atípicos
Estandarizamos los valores de cada variable (Z).
Test de Grubbs
. Detección bivariante de casos atípicos
Útil si la variable de análisis se considera como dependiente de otra.
Detección multivariante de casos atípicos
Supuestos básicos de análisis multivariante
Homocedasticidad
En el caso de datos agrupados. ANOVA
En el caso de datos no agrupados. Regresión lineal
Linealidad
Se realizan gráficos de dispersión bivariante entre todas las variables y se analiza la linealidad en dichos gráficos y sus respectivos valores R
Normalidad
Análisis univariante
Se puede utilizar las pruebas de asimetría (A=0) y de curtosis (C=3), gráficos Q‐Q (si n>20), o pruebas como Kolmogorov‐Smirnov (muestras grandes) o Shapiro Wilks
Análisis multivariante
Chi‐cuadrado
Independencia de las observaciones
Dos observaciones son independientes cuando los valores que toman las variables en un caso no se ven afectadas por los valores de otro caso
Sesión 3
Elaborado por: Diego Rivera