Please enable JavaScript.
Coggle requires JavaScript to display documents.
Knowledge Discovery in Databases (KDD) (Fases de KDD (1. Integración y…
Knowledge Discovery in Databases (KDD)
Minería de Datos
Proceso de extraer conocimiento útil y comprensible, antes desconocido, a partir de grandes volúmenes de datos almacenados en formatos distintos.
Tipos de Modelos
Predictivos
Clasificación
Asocia datos a grupos predefinidos (aprendizaje supervisado). Encuentra modelos (funciones) que describen y distinguen clases o conceptos para futuras predicciones.
Regresión
Relación entre dos (o más) variables a través de un modelo formal, cuenta con una expresión lógico-matemática que, además de resumir cómo es esa relación, va a permitir realizar predicciones de los valores que tomará una de las dos variables.
Descriptivos
Agrupamiento (clustering)
Analiza los datos para generar un identificador de grupo, el cual, permite crear grupos de objetos muy similares entre sí, separándolos de los elementos pertenecientes a otros grupos.
Correlación
Determina el grado de similitud entre los valores pertenecientes a dos variables numéricas.
Reglas de Asociación
Identifica relaciones no explícitas entre atributos categóricos, que no necesariamente implica la existencia de una relación causa-efecto.
Reglas de Asociación Secuenciales
Busca relaciones basadas en el tiempo.
Fases de KDD
1. Integración y recopilación de datos
Se determinan las fuentes de datos y el tipo de información a utilizar. Los datos relevantes para el análisis son extraídos desde la o las fuentes de datos.
2. Selección, limpieza y transformación
Preparación y limpieza de los datos extraídos desde las distintas fuentes de datos en una forma manejable, necesaria para las fases posteriores. Se utilizan diversas estrategias para manejar datos faltantes o en blanco, datos inconsistentes o que están fuera de rango, obteniéndose al final una estructura de datos adecuada para su posterior transformación.
3. Minería de Datos
Es el modelamiento, en donde métodos inteligentes son aplicados, con el objetivo de extraer patrones previamente desconocidos, válidos, nuevos, potencialmente útiles y comprensibles y que están contenidos u “ocultos” en los datos.
4. Evaluación e interpretación
Se identifican los patrones obtenidos y que son realmente interesantes, basándose en algunas medidas y se realiza una evaluación de los resultados obtenidos.
5. Difusión y Uso
Difusión, monitoreo y uso del nuevo conocimiento
Tipos de métodos
Permiten resolver tareas, no existe un método universal aplicable a todas las tarea.
Inferencia Estadística
Árboles de decisión
Redes Neuronales
Inducción de Reglas
Aprendizaje basado en instancias
Algoritmos Genéticos
Aprendizaje Bayesiano
Programación Lógica Inductiva
Métodos basados en núcleos