Please enable JavaScript.
Coggle requires JavaScript to display documents.
La metodología y el científico de la ciencia de datos, image, image, image…
La metodología y el científico de la ciencia de datos
Metodologías de la ciencia de los datos
Metodología Fundamental
para la Ciencia de Datos
Proporciona una estrategia de orientación, independiente de las tecnologías, los volúmenes de datos o los enfoques involucrados
Pasos
Comprensión del negocio
Enfoque analítico
Requisitos de datos
Recopilación de datos
Comprensión de datos
Preparación de datos
Modelo
Evaluación
Implementación
Retroalimentación
Usos
Utilizado para predecir resultados o para descubrir
patrones.
KDD (Knowledge Discovery in Databases)
Proceso de identificar patrones válidos, novedosos, potencialmente útiles y principalmente entendibles.
Pasos
Selección
Pre-procesamiento
Transformación
Minería de datos
Interpretación y evaluación
Usos
En marketing es usado para analizar los datos recolectados de clientes de determinada marca.
CRIPS-DM (Cross-Industry Standard Process for Data Mining)
Método probado para orientar los trabajos de minería de datos, en la que si existe un error es posible regresar a cualquier etapa anterior
Pasos
Entendimiento de negocio
Data Understanding
Data preparation
Modeling
Evaluación
Deployment
Usos
Útil para planificar y explicar la gestión y ejecución de los proyectos.
SEMMA (Sample, Explore, Modify, Model and Access)
Metodología que ayuda a los profesionales a convertir datos en conocimiento
Pasos
Sample o muestreo
Explorar
Modificar
Modelaje
Acceso evaluar de la confidencialidad
Usos
Aplicada en la exploración estadística.
Científico de datos
Cualidades
Curiosidad
Mis cualidades
Curiosidad por aprender
Me falta desarrollar la habilidad de comunicación
Habilidad de comunicar
Creativo
Habilidades
Negocio, desarrollo de producto y empresa
Matemáticas
Machine Learning y Big Data, datos estructurados y no estructurados.
Programación
Estadística
Funciones
Recopilar grandes cantidades de datos revueltos y transformarlos a un formato más utilizable.
Resolver problemas relacionados con negocios empleando técnicas basadas en datos.
Trabajar con diversos lenguajes de programación, incluidos SAS, R y Python.
Dominar técnicas analíticas como el machine learning, deep learning y analítica de texto.
Comunicarse y colaborar con las áreas de TI y de negocios.
Buscar orden y patrones en datos, además de detectar tendencias que puedan ayudar a la base de operación de una empresa.