Please enable JavaScript.
Coggle requires JavaScript to display documents.
PREPARACIÓN DE DATOS - Coggle Diagram
PREPARACIÓN DE DATOS
pre procesamiento
-
Limpieza de datos
problemas de calidad, es decir tener datos muy ruidosos, inconsistentes, redundantes,
incompletos
-
subdivide en
Datos incompletos
-
-
medidas :pen:
-
-
-
-
Un valor puede se asignado, si es comun a todos o la mayoria de
datos
Utilizar la media, moda, o mediana de los valores conocidos.
Datos inconsistentes
-
Para resolver se crean metodos automatizados de extracción consistente de datos y en caso complejos
manualmente :pen:
-
Datos con ruido
¿?
como una varianza, los datos inconsistentes pueden ser resultado de la presencia de ruido.
Para correción de ruido se suele aplicar estadística: técnica
basada en distribución y/o concepto de profundidad :pen:
Muestreo de datos
cuanto más datos son utilizados, se consigue un mayor tasa de predicción (mayor exactitud), pero menor eficiencia computacional
Para crear un equilibrio de exactitud con eficiencia en caso de contar con muchos datos se debe realizar un
muestreo de datos
estrategias
-
Muestreo estratificado
Existen datos donde la cantidad de objetos por clase es muy diferente, entonces el muestreo debe permitir
obtener una cantidad homogenea de clases
Muestreo progresivo
Con esta estrategia, se elige una muestra pequeña, si la exactitud de predicción es mala, se incrementa
gradualmente hasta conseguir una exactitud aceptable
-
Integración de datos
En algunos esquemas de trabajo, los datos están distribuidos en diferentes conjuntos de datos o bases
de datos
Estos dispersos, deben ser integrados en un único
conjunto.
-
-
-