Please enable JavaScript.
Coggle requires JavaScript to display documents.
Descubrimiento y caracterización - Coggle Diagram
Descubrimiento y caracterización
Preparación de los datos
2 fases
Descubrimiento de los datos
determinar la fuente original a partir de la cual se construirá el dataset
2 preguntas
son accesibles los datos?
Barreras legales
acceso departamental
Formato de los datos
Conectividad
Razones arquitectónicas
diferentes arquitecturas de BD
Tiempo
como los obtengo?
Caracterización de los datos
despues de encontrar las distintas fuentes (flujos)
caracterizar naturaleza de los flujos
Granularidad
detalle
Consistencia
datos no demasiado incoherentes
posible corrección
Contaminación
extender un sistema más allá de su funcionalidad original
Objetos medibles
comprender naturaleza del objeto que se mide
Relaciones
relaciones entre fuentes (flujos)
Dominios
detectar valores fuera del domino de una variable
Valores por defecto
sistemas que inlcuyen estos valores
Integridad
detectar valores atípicos
valores potencialmente fuera de los limites
relaciones entre los valores de distintas variables
Concurrencia
distintos momentos de la captura de datos entre distintos flujos
Variables duplicadas o redundantes