Minería de Datos
Tipología de tareas
Métodos
Técnicas
Asociación entre disciplinas
Importancia de la minería de datos
Impacto en la era de la información en las industrias
Clasificación (Etiquetas de clase)
Regresión (Predicción numérica)
Agrupamiento (No Etiquetas de clase)
Supervisados (Datos etiquetados)
No supervisados (Sin etiquetas de datos)
Modelado Descriptivo (Descubre similitudes para determinar éxito o fracaso)
Modelado Predictivo (Estima resultados desconocidos)
Modelado Prescriptivo (Analiza variables para recomendar cursos de acción)
Estadística (Estudio numérico de las relaciones de datos)
Inteligencia artificial (Similar a la humana mostrada por software y / o máquinas)
Aprendizaje automático (Algoritmos que aprenden de los datos para hacer predicciones)
Encuentra anomalías, patrones y correlaciones para predecir resultados.
Comprende que datos son relevantes para evaluar los posibles resultados.
Acelera el ritmo para tomar decisiones informadas.
Más del 50% de la población activa de los Estados Unidos está laborando en el campo de la información.
4to sector de la economía en Estados Unidos.*
70% de la población activa en Europa Capitalista laborará en el sector de la información.*
El campo de la información, es sinónimo de liderazgo político, económico, cultural, militar, es válida la ecuación: información igual poder.*
La información se ha convertido en actor principal de la economía, la ciencia, de la cultura y de la política.*
Algoritmos de clasificación (El atributo objetivo es "categórico")
Algoritmos de regresión (El atributo objetivo es "numérico")
Métodos Jerárquicos (Distintos niveles de agrupación)
Métodos Particionales (Ningún tipo de organización jerárquica)
Agrupación (Agrupando registros similares juntos)
Aprendizaje de reglas de asociación (Detectando relaciones entre registros)
Análisis de componentes principales (Detectando relaciones entre variables)
Agrupación de afinidad (Agrupación de personas con intereses comunes u objetos similares)
Regresión (Relación entre una variable dependiente y una serie de variables independientes)
Redes neuronales (Programas de computadora que hacen patrones, predicciones y aprenden)
Arboles de decisión (Diagramas en forma de árbol en los que cada rama representa una ocurrencia probable.)
Máquinas de vectores de soporte (Modelos de aprendizaje supervisados con algoritmos de aprendizaje asociados)
Análisis predictivo más reglas (Desarrollar reglas if / then a partir de patrones y predecir resultados)
Optimización de Marketing (Simulando la mezcla de medios más ventajosa en tiempo real para obtener el ROI más alto posible)