Please enable JavaScript.
Coggle requires JavaScript to display documents.
Limpieza Datos - Coggle Diagram
Limpieza Datos
Missing Values
valor de atributo faltante o perdido
causas
complicaciones manejo de datos
pérdida eficacia
diff entre datos faltantes y completos
soluciones
soluciones simples
no hacer nada (DNI)
comprobar si el algoritmo funciona mejor con el dataset original
eliminar o ignorar (IM)
si el dataset es grande
sustituir por valor común (nominales) o media (numéricos) (MC)
metodos de imputacion de máxima verosimilitud
técnicas estimadores
expectativa - maximización (EM)
funciona mejor con distribuciones de probabilidad
subestima errores
rellena MV resolviendo iterativamente los datos observados
imputación multiple
menos sesgado, más computo
Monte Carlo
análisis bayesiano de componentes principales (PBCA)
regresión componentes principales (PC)
estimación bayesiana
algoritmo repetitivo tipo EM
usando ML