Please enable JavaScript.
Coggle requires JavaScript to display documents.
LA METODOLOGÍA Y EL CIENTÍFICO DE LA CIENCIA DE DATOS - Coggle Diagram
LA METODOLOGÍA Y EL CIENTÍFICO DE LA CIENCIA DE DATOS
Metodología R es un software para análisis estadístico y gráficas
Más sencillo de aprender cuando se está familiarizado con datos y análisis
Para gráficas y reportes
De gran utilidad para análisis estadísticos puntuales
Generalmente utilizado por académicos o científicos, BI o negocios
Metodología Python es un lenguaje de propósito universal
Más orientada a objetos, clases, métodos
Se integra con otros programas
Para productos de datos
Se utiliza en ingeniería de software y de datos
Metodología fundamental para la ciencia de datos
Etapa 1 COMPRENSIÓN DEL NEGOCIO Etapa 2. ENFOQUE ANALÍTICO. Etapa 3 REQUISITOS DE DATOS Etapa4 RECOPILACIÓN DE DATOS Etapa 5 COMPRENSIÓN DE DATOS Etapa 6 PREPARACIÓN DE DATOS Etapa 7 MODELADO Etapa 8 EVALUACIÓN Etapa 9 IMPLEMENTACIÓN Etapa 10 RETROALIMENTACIÓN
EL CIENTÍFICO DE DATOS se espera que analice y actúe en los momentos críticos del negocio
Ingeniero ( Soluciona el problema del negocio)
Desarrollador (maneja la infraestructura)
Estadístico (valida el modelo
Que cualidades debe poseer un científico de datos?
Entender el problema a resolver
Solo cuando se ha comprendido la materia prima con que se trabaja se puede comprender lo que pretendemos resolver
Busca correlaciones de patrones de comportamiento
El área de conocimiento que abarca estas técnicas se conoce Machine Learning o Statical Learning
El conjunto de datos se divide en conjunto de entrenamiento (66%) y otro de test (el porcentaje restante)
Comprender la tecnología disponible
De nada servirá resolver el problema si no se dispone de la infraestructura adecuada para obtener una solución práctica, precisa y correcta
Ser experto en las 3 áreas (entender datos, entender el problema y contar con la tecnología disponible) es prácticamente imposible, lo más lógico es crear equipos multidisciplinarios con expertos en cada área
Entender los datos
Generalmente nos enfrentamos a esta parte de acuerdo a la intuición y experiencia. Diferentes personas pueden usar los mismos datos con diferentes finalidades sin ser competencia entre ellos
CUALIDADES PERSONALES DEL CIENTÍFICO DE DATOS
Las diferentes habilidades se agrupan en 5 tipos:
MATEMÁTICAS: optimización, matemáticas, modelos gráficos, estadística bayesiana y modelos de Monte Carlo, algoritmos y simulación
PROGRAMACIÓN: administración de sistemas y programación
MACHINE LEARNING/BIG DATA: Datos estructurados y no estructurados
ESTADÍSTICA: Visualización, series temporales, estadística espacial, estadística clásica, manejo de datos y supervivencia y marketing
NEGOCIO: Desarrollo de productos y empresas
Perfiles de personalidad
El investigador de datos debe dominar estadística y matemáticas, su principal función será el planteamiento y solución del problema
El creativo de datos precisa habilidades mas amplias sin ser experto en ninguna materia en sí. Su función es imaginar soluciones creativas.
El desarrollador de datos debe tener amplios conocimientos en programación y machine learning. Su función es aplicar la tecnología disponible para solucionar problemas
El empresario de datos debe ser experto en negocios, conocer de machine learning y estadística y nociones de matemáticas o programación. Es el encargado de convertir en un producto comercializable el trabajo de sus otros compañeros.