Please enable JavaScript.
Coggle requires JavaScript to display documents.
Metodologías para el Análisis de Datos, Santiago Roa Alvarado 9A DGS -…
Metodologías para el Análisis de Datos
CRISP-DM (Cross-Industry Standard Process for Data Mining)
Es una de las metodologías más populares para proyectos de análisis de datos.
Etapas
Comprensión del negocio
Comprensión de los datos
Preparación de los datos
Modelado
Evaluación
Despliegue
KDD (Knowledge Discovery in Databases)
Es un proceso enfocado en extraer conocimiento útil y comprensible a partir de grandes volúmenes de datos.
Etapas
Selección de datos
Preprocesamiento
Transformación
Minería de datos
Interpretación/Evaluación
SEMMA (Sample, Explore, Modify, Model, Assess)
Propuesta por SAS, es una metodología orientada a la exploración y modelado estadístico.
Etapas
Muestra (Sample)
Explora (Explore)
Modifica (Modify)
Modela (Model)
Evalúa (Assess)
Propuesta de Metodología Propia para el Análisis de Datos
Definición del problema
Clarificar los objetivos del análisis.
Establecer preguntas clave que se desean responder.
Recolección de datos
Identificar fuentes de datos (bases de datos, APIs, archivos).
Obtener los datos necesarios para el análisis.
Limpieza y preparación de datos
Eliminar datos duplicados, inconsistentes o incompletos.
Transformar variables, normalizar o codificar según se necesite.
Exploración de datos (EDA)
Uso de estadísticas descriptivas y visualizaciones.
Identificar patrones, anomalías y relaciones entre variables.
Modelado de datos
Aplicar modelos estadísticos, de aprendizaje automático o minería de datos.
Evaluación y validación
Medir el rendimiento del modelo con métricas apropiadas.
Comunicación de resultados
Elaborar visualizaciones, informes o dashboards.
Presentar conclusiones de manera clara y comprensible.
Implementación y monitoreo
Poner en práctica los resultados del análisis.
Monitorear el desempeño y actualizar modelos si es necesario.
Santiago Roa Alvarado 9A DGS