Please enable JavaScript.
Coggle requires JavaScript to display documents.
LIMPIEZA DE DATOS - Coggle Diagram
LIMPIEZA DE DATOS
TÉCNICAS
Obtención de datos
Atributos Nominales
Toman valores en un
conjunto finito y preestablecido de categorías.
Podemos detectar:
Valores nulos
Utilizamos el nodo "Seleccionar" para descartar con la función "NULL(CAMPO)".
Se refiere a un valor desconocido indefinido.
Valores incompletos
Con el nodo "Rellenar" podemos agregar la información faltante.
Son valores inicializados pero que no han sido completados.
Valores redundantes
Se refiere a la existencia de un fato de manera repetida.
Atributos Numéricos
Contienen valores enteros o reales.
Podemos detectar:
Valores nulos
Valores incompletos
Valores anómalos
Son datos atípicos que se desvían en alguna dirección respecto al comportamiento general del resto de conjunto de datos.
Podemos usar el nodo "Seleccionar" para eliminar los datos anómalos.
IMPORTANCIA
Ahorra costes de espacio en disco.
Agiliza las consultas.
Evita la información no veraz o errónea.
Ayuda a tomar decisiones estratégicas.
Asegura la calidad de los datos.
DEFINICIÓN
Remover ruido e inconsistencia de
datos .