Please enable JavaScript.
Coggle requires JavaScript to display documents.
Introducción a la minería de datos - Coggle Diagram
Introducción a la minería de datos
Definición
Búsqueda automática de patrones en enormes bases de datos usando técnicas computacionales desde estadísticas, machine learning y reconocimiento de patrones
La extracción no trivial de implícita, previamente desconocida y potencialmente útil información desde los datos
La ciencia de extraer información útil de largos conjuntos de datos o bases de datos
La exploración automática o semi-automática y análisis de largas cantidades de datos, con el fin de descubrir patrones significativos
El proceso de descubrimiento automático de información, la identificación de patrones y relaciones ocultas en la información
Aplicaciones
Objetivos predictivos
Clasificación, regresión, detección de anomalías alcanzados por usar una parte de las variables para predecir una o más de las otras variables
Objetivos descriptivos
Clustering, descubrimiento de la regla de asociación, descubrimiento de patrones secuenciales alcanzados por la identificación de patrones que describen la información y que puede ser fácilmente entendido por el usuario
Etapas
Clase
La variable dependiente del modelo, la cual es una variable categórica representando la "etiqueta" puesta en el objeto después de su clasificación
Predictores
Las variables independientes del modelo, representadas por características o atributos de la información a ser clasificada y basada en la cual la clasificación se hace
Conjunto de datos de entrenamiento
Conjunto de datos que contiene los valores de los dos componentes anteriores y son usados para entrenar el modelo
Conjunto de datos de prueba
Contiene nueva información que será clasificada por el modelo clasificador construido anteriormente, y donde se evaluará el desempeño del modelo
Bases
Precisión predictiva
Se refiere a la habilidad del modelo de clasificar correctamente cada objeto nuevo, desconocido
Velocidad
Se refiere a qué tan rápido el modelo puede procesar información
Escalabilidad
Se refiere principalmente a la habilidad del modelo de procesar de manera creciente un volumen más largo de información, así como la habilidad de procesar información en diferentes campos
Interpretabilidad
Ilustra la capacidad del modelo para ser entendido e interpretado fácilmente
Simpleza
Se refiere a la habilidad del modelo de no ser muy complicado, a pesar de su efectividad
Tipología de métodos utilizados
Métodos predictivos
Usa variables existentes para predecir valores futuros
EJEMPLOS: Clasificación, regresión, detección de anomalías
Métodos descriptivos
Revela patrones en la información, fácilmente interpretados por el usuario
EJEMPLOS: Clustering, reglas de asociación, patrones secuenciales