Please enable JavaScript.
Coggle requires JavaScript to display documents.
Metodologías Minería de Datos (KDD Knowledge Discovery in Databases…
Metodologías Minería de Datos
KDD
Knowledge
Discovery in
Databases
Proceso secuencial e iterativo
Busca encontrar patrones
Por medio de modelos matemáticos
Fases
Selección: Determina objetivos
Precisos
Medibles
Preprocesamiento: recolecta datos
Base de datos
Coherente
Confiable
Relevante
Actualizada
Transformación: Grafica los datos
Elimina outlayers
Disminuye dimensiones
Minería de datos: selección
del algoritmo
Cluster
Series de tiempo
Regresión
Árboles de decisión
Red neural
Bayes ingenuo
Evaluación: verifica
supuestos de validación
Cros-validation
CRISP-DM
Cross
Industry
Standard
Process
Relaciona proyectos
a partir de la resolución
de uno
Fases
Comprensión del negocio
Objetivos
No técnicos
Concretos
Orientados al negocio
Ejemplos:
120% rentabilidad
$ ventas
$utilidad
Luego se hace plan
enfocado a
Herramientas
Estrategias
Equipo
Ejemplos
Disminuri costos
Aumento puntos venta
20% de personal
Comprensión de los datos
Construcción de la BD
Explorar/analizar
la información
Formular hipotesis
Preparación de los datos
Nombrar/Describir
Variables
Ventas
Costos
Puntos de venta
Personal
Limpiar base de dato
Eliminar outlayers
Reducir dimensiones
Modelado
Eleccíón del algoritmo
Evaluación
Despliegue
Medidas para cumplir el
plan del paso 1
Informe de hayazgos
Periodo de monitoreo
SEMMA
Sample
Explores
Modify
Model
Assess
Enfoca la parte técnica
fases
Muestreo
Elección de muestra
significativa de la BD
Muestreo simple aleatorio
o nodo de partición
(subconjuntos)
Exploración
Análisis estadístico
Herramientas de MD
Identificación
Outlayers
Faltantes
Tendencias
Ciclos
Modificación
Selección /identificación
variables
Muchas?
Método de componentes principales
Modelado
Selección de algoritmo
Relación entre variables
Posibles combinaciones de datos
Valoración
Compara modelos seleccionados
Puede servir la curva ROC