La metodología y el científico de la ciencia de datos.
Metodologías
Algunas metodologías son
Metodología Fundamental
para la Ciencia de Datos (IBM)
Sus usos son
Encontrar problemas que aún no son atendidos
Descubrir tendencias
CRISP-DM
Knowledge Discovery in Databases
Una metodología
Es una estrategia general que
sirve de guía
No depende de tecnologías ni
herramientas específicas
Proporciona un marco sobre
cómo proceder
Abarca los 5 pasos del proceso de análisis de datos
Ciclo de vida de minería de datos
Se presenta por primera vez en Brúcelas en 1999 durante una conferencia sobre temas de minería de datos
Es un proceso iterativo e interactivo de
búsqueda de modelos, patrones o parámetros.
Trabajan con
Datos
Categóricos
Numéricos
Algoritmos
Especializados en la minería de datos
De propósito especifico (clasificación, regresión, agrupación, etc.)
Etapas del proceso KDD
Resolver problemas complejos
Científico de datos
Tiene como funciones
Recopilar
Analizar e interpretar datos
Transformar los datos
Tiene como cualidades
Visión del negocio
Conocimiento de estadística y matemática
Comunicación y colaboración
Dominio de técnicas basadas en datos
Comprensión de lenguajes de programación
Tiene como habilidades
Programación y bases de datos
Lenguajes de alto nivel (Python)
Paquetes de computación estadística (R)
Administración de bases de datos (SQL, No SQL)
Comunicación y visualización
Habilidad narrativa
Diseño artístico visual
Paquetes R
Conocimiento del negocio y habilidades emocionales e impersonales :
Pasión por el negocio
Mentalidad hacker
Solucionador de problemas
Matemáticas y estadística
Modelación estadistica
Diseño experimental
Machine learning
Proceso