Please enable JavaScript.
Coggle requires JavaScript to display documents.
Business analytics FOTO1 - Coggle Diagram
Business analytics
Conceptos básicos
Analítica
Tecnologías
Tareas
Predictiva
Variables predictoras
Variable objetivo
Descriptiva
Variables de entrada
Técnicas
Predictiva
Variable objetivo cuantitativa
Regresión lineal
Redes neuronales
Máquina de soporte vectorial
KNN
Árbol de regresión
Bosques aleatorios
Ensambles
Variable objetivo cualitativa
Redes neuronales
Máquina de soporte vectorial
Regresión logística
KNN
Árbol de decisión
Bosques aleatorios
Naive Bayes
Ensambles
Descriptiva
Variables de entrada
Clustering
Redes neuronales tipo SOM
Reglase de asociación
Detección de anomalías
Patrones secuenciales
Algoritmos
Caja negra
Orientado al conocimiento
Definición
Busca extraer conocimiento
Válido
Previamente desconocido
Útil y comprensible
A partir de datos
Semi estructurados
No estructurados
Estructurados
Sinónimo
Minería de datos
Herramientas
Software KNIME
Áreas relacionadas
Principios
Ciencia de Datos
Computación
Matemáticas y Estadística
Conocimiento del Dominio
Técnicas
Aprendizaje de Máquina
Deep Leraning
Inteligencia Artificial
Tecnologías
Big Data
Velocidad
Variedad
Volumen
Metodología Proyecto de Analíca
Entender el negocio
Determinar los objetivos del negocio
Evaluar Situación
Determinar los objetivos de la minería de datos
Producir el plan del proyecto
Entender los datos
Recolectar datos iniciales
Revisar si los datos disponibles son suficientes
Revisar si se tienen datos completos o datos agregados
Revisar si se seleccionan todos los datos o una muestra
Describir datos
Cantidad de datos
Tipos de atributos
Cualitativos
Nominales
Valores arbitrarios
Ordinales
Hay un orden a los niveles
Cuantitativos
Discretos
Toma ciertos valores determinados
Continuos
No está restringido a valores determinados
Esquema de codificación
Explorar datos
Conocer la tendencia central
Analizar la dispersión
Visualizar datos
Verificar la calidad de los datos
Datos faltantes
Errores
Inconsistencias
Preparar los datos
Limpieza de datos
Revisión de calidad
Datos perdidos
Datos inconsistentes
Datos atípicos
Datos redundantes
Selección de atributos
Atributos redundantes
Atributos con valores unicos
Atributos con valores diferentes
Atributos sinónimos de variable objetivo o no observables
Creación de la vista minable
Normalización
Min-Max
Estadística
Escalamiento decimal
Discretización
Por intervalos de igual amplitud
De igual frecuencia
De frecuencia fija
Usando clustering
Numerización
De 1 a 1
De 1 a n
De n a m
Sobremuestreo y submuestreo
Submuestreo
Reducir tamaño de datos
Sobremuestreo
Aumentar tamaño de datos
Generación de variables derivadas
Combinar 2 o más variables
Análisis de variables
Relacionar 1 variable y todas
Anonimización
Eliminar identificadores
Revisar cuasi identificadores
Ofuscar
Modelar
Seleccionar la técnica de modelamiento
Generar el diseño de prueba
Construir el modelo
Evaluar el modelo
Evaluar
Evaluar los resultados
Revisar el proceso
Determinar los siguientes pasos
Deployment
Planear el deployment
Planear el monitoreo y mantenimiento
Producir el reporte final
Revisar el proyecto
Analítica predictiva
Clasificación
Variables de entrada
Cualitativas
Cuantitativas
Tipos
Binaria
Multiclásica
Objetivo
Predecir la clase
Requisitos
Conjunto de entrenamiento
Conjunto de datos etiquetados
Exhaustivos
Exclusivos
Técnicas
Enfoque basado en modelos
Tabla de probabilidades
Árbol de decisión
Componentes
Nodo raiz
Nodo interno
Arco
Hoja
Algoritmos
ID 3 Y C4.5
Entropía
Particionamiento
Ganancia normalizada
CHAID
CART
Redes neuronales
Bosques aleatorios
Ensambles
Componentes
Clasificador
Combinación
Fases
Entrenamiento
Pruebas
Algoritmos
Baggig
Boosting y ADA Boost
Random forest y extra trees
Stacking
Máquinas de soporte vectorial
Regresión logística
Enfoque perezoso
KNN
Función distancia
Euclidiana
Manhatan
Coseno
Secuencias
Distancia de Levenshtein
Cualitativas
Distancia de hamming
Validación
Validación por retención
Datos de entrenamiento
Datos prueba
Validación cruzada
Iteracciones
Datos entrenamiento
Datos prueba
Desempeño
Matriz de confusión
Exactitud (Accuracy)
Presición por clase
Exhaustividad (Recall)
F-Measure
Sensibilidad
Especificidad
Matriz de confusión con clases politómicas
Analítica descriptiva
Técnicas
Clustering
Principios
Alta cohesión y bajo acoplamiento
Similitud y disimilitud
Funciones de distancia
Atributos cuantitativos
Distancia Euclidiana
Distancia Manhattan
Distancia Chebysev
Atributos cualitativos o mixtos
Atributos con frecuencia o datos binarios asimétricos
Similitud de Coseno
Similitud de Jaccard
Cadena de caracteres
Distancia de Hamming
Distancia de Levenshtein
Comparando cústers
Distancia entre clústers
Enlace simple
Enlace completo
Enlace promedio
Enlace centroides
Características de un clúster
Radio
Diámetro
Algoritmos
Algoritmos jerárquicos
Algoritmos aglomerativos
Algoritmos divisivos
Algoritmos por particionamiento
K - means
Silueta del cluster
Método del codo
K-vecinos más cercanos
K- medioides
Basados en densidad
Reglas de asociaicón
Medidas
Soporte
Confianza
Mejora
Algoritno
A priori
Objetivo
Descubrir patrones
Variables de entrada
Cuaitativas
Cuantitativas