Please enable JavaScript.
Coggle requires JavaScript to display documents.
La metodología y el científico de la ciencia de datos - Coggle Diagram
La metodología y el científico de la ciencia de datos
Metodologías
Minería de Datos
Proceso KDD
Se refiere al proceso de identificar patrones válidos, novedosos, potencialmente útiles y principalmente entendibles
Metodologia
1- Formular problema
2- Determinar presentación
3- Identificar y recolectar datos de entrenamiento
4- Preparar datos para análisis
5- Selección de modelo, construcción y entrenamiento
6- Evaluar lo aprendido
7- Integrar la base de conocimiento a la espera de nuevos datos tras acciones
Metodología IBM
Esta metodología tiene algunas similitudes con las metodologías reconocidas para la minería de datos, pero pone el énfasis en varias de las nuevas prácticas en la ciencia de datos, como el uso de grandes volúmenes de datos, la incorporación de la analítica de texto en el modelado predictivo y la automatización de algunos procesos.
Metodología
1- Comprensión del negocio
2- Enfoque analitico
3- Requisitos de datos
4- Recopilación de datos
5- Comprensión de datos
6- Preparación de datos
7- Modelado
8- Evaluación
9- Implementación
10- Retroalimentación
Científicos
Tipos de científicos de Datos
Desarrollador
debe tener amplios conocimientos en programación y Machine Learning, en menor medida en matemáticas, y solo precisa de conocimientos genéricos en negocio y en estadística. Su función principal es seleccionar las infraestructuras y programar los algoritmos que darán solución al problema.
Investigador
deberá tener unos profundos conocimientos de estadística y matemáticas, y utilizará muy poco la programación, el Machine Learning y los negocios. Su principal característica será el planteamiento y solución del problema con los datos disponibles. Su trabajo consistirá en determinar cuáles son las mejores metodologías para la resolución de un problema concreto.
Creativo
La principal función es imaginar soluciones creativas para un conjunto de datos
Empresario
Deberá ser experto en Negocios por delante de las otras cuatro habilidades. Debe tener conocimientos de Machine Learning y estadística, y solamente ciertas nociones de matemáticas o programación. Es el encargado de convertir en un producto comercializable el trabajo de sus otros compañeros.
Agrupación de habilidades
Negocio
Desarrollo de producto y empresa
Machine Learning/Big Data
Datos estructurados y no estructurados, Machine Learning y almacenamiento de datos distribuidos.
Matemáticas
Optimización, matemáticas, modelos gráficos, estadística
Programación
Administración de sistemas y programación
Estadística
Visualización, series temporales, estadística espacial,
estadística clásica, manejo de datos y supervivencia y marketing
Habilidades que requiero aprender