Minería de Datos Mineria de datos

Tipología de tareas

Métodos

Técnicas

Asociación entre disciplinas

Importancia de la minería de datos

Impacto en la era de la información en las industrias

Clasificación (Etiquetas de clase) Clasificación

Regresión (Predicción numérica) Regresión

Agrupamiento (No Etiquetas de clase) Agrupamiento

Supervisados (Datos etiquetados)Supervisado

No supervisados (Sin etiquetas de datos) No supervisado

Modelado Descriptivo (Descubre similitudes para determinar éxito o fracaso) Descriptivo

Modelado Predictivo (Estima resultados desconocidos) Predictivo

Modelado Prescriptivo (Analiza variables para recomendar cursos de acción) Prescriptivo

Estadística (Estudio numérico de las relaciones de datos) Estadistica

Inteligencia artificial (Similar a la humana mostrada por software y / o máquinas) Inteligencia artificial

Aprendizaje automático (Algoritmos que aprenden de los datos para hacer predicciones) Aprendizaje automatico

Encuentra anomalías, patrones y correlaciones para predecir resultados.

Comprende que datos son relevantes para evaluar los posibles resultados.

Acelera el ritmo para tomar decisiones informadas.

Más del 50% de la población activa de los Estados Unidos está laborando en el campo de la información.

4to sector de la economía en Estados Unidos.*

70% de la población activa en Europa Capitalista laborará en el sector de la información.*

El campo de la información, es sinónimo de liderazgo político, económico, cultural, militar, es válida la ecuación: información igual poder.*

La información se ha convertido en actor principal de la economía, la ciencia, de la cultura y de la política.*

Algoritmos de clasificación (El atributo objetivo es "categórico")

Algoritmos de regresión (El atributo objetivo es "numérico")

Métodos Jerárquicos (Distintos niveles de agrupación)

Métodos Particionales (Ningún tipo de organización jerárquica)

Agrupación (Agrupando registros similares juntos)

Aprendizaje de reglas de asociación (Detectando relaciones entre registros)

Análisis de componentes principales (Detectando relaciones entre variables)

Agrupación de afinidad (Agrupación de personas con intereses comunes u objetos similares)

Regresión (Relación entre una variable dependiente y una serie de variables independientes)

Redes neuronales (Programas de computadora que hacen patrones, predicciones y aprenden)

Arboles de decisión (Diagramas en forma de árbol en los que cada rama representa una ocurrencia probable.)

Máquinas de vectores de soporte (Modelos de aprendizaje supervisados con algoritmos de aprendizaje asociados)

Análisis predictivo más reglas (Desarrollar reglas if / then a partir de patrones y predecir resultados)

Optimización de Marketing (Simulando la mezcla de medios más ventajosa en tiempo real para obtener el ROI más alto posible)