Please enable JavaScript.
Coggle requires JavaScript to display documents.
Introducción a la Ciencia de Datos, ed0c11d8-d907-44c5-8a18-83301219aee6,…
Introducción a la Ciencia de Datos
Qué es ciencia de datos
Estudio de datos
Para obtener info. significativa de empresas
Enfoque multidisciplinario
Matemáticas
Estadística
IA
Ingeniería computacional
Responde preguntas
¿Qué pasó?
¿Por qué?
¿Qué pasará?
¿Qué se puede hacer con los resultados?
Ejemplo
Innovación en soluciones
Programa analiza comentarios de clientes de una tienda en redes sociales
Identifica áreas de mejora
Encuentra solución
Aumenta satisfacción del cliente
Qué es la analítica de datos
Acciones que permiten recolectar y aprovechar datos
Con el fin de encontrar tendencias
Oportunidad de negocios
Clasifica y separa
Diferentes tipos de datos
Ejemplo
Empresa que vende focos
Analiza datos como...
Principales usuarios
Cuánto se vende
De qué tipos
En qué meses
Dónde los compran
Para
Reducir pérdidas
Optimizar procesos de producción
Qué es Big Data
Grandes volúmenes de datos
A menudo no estructurados
Puede ocupar terabytes y petabytes
Formatos: Texto, vídeo, sonido, imágenes, etc.
Superan capacidad del software habitual
Para ser capturados, gestionados y procesados
En tiempo razonable
Ejemplo
Smartwatch
Monitoreo de horas de sueño, tipo de ejercicio, dieta, etc.
Ciencia de datos y película "Margin Call"
Proyección de datos
Interpretación de analista
-Si los activos disminuyen 25%, la pérdida será mayor que la capitalización del mercado actual de la compañía entera
Se predice el resultado de continuar con las condiciones actuales
Se anticipan a resultados y pueden crear plan de acción
Crisis económica
Ciencia de datos y película "The Big Short"
Análisis de información
Administrador de cuentas de inversión observa datos que nadie había revisado
Encuentra que las hipotecas de los bancos no tienen bajo riesgo
No se están pagando realmente
Solicita a banco un instrumento de inversión para invertir contra los préstamos.
Gana dinero cuando los seguridades hipotecarias de los bancos pierden
Utiliza la analítica de datos para predecir una ganancia que puede obtener
Metodología CRISP DM
Fases
Despliegue
Planeación del monitoreo y mantenimiento.
Reporte y revisión de resultados
Modelación de los datos
Se responden preguntas que se interpretan como técnicas de modelación
¿Qué grupo? (agrupación en clústeres
¿Es extraño? (detección de anomalías)
¿Qué categoría? (Clasificación)
¿Qué opción se debe elegir? (recomendación)
¿Cuánto/s? (Regresión)
Entendimiento del negocio
Se identifica meta u objetivo
y después qué se necesitaría conocer para lograr meta
Entendimiento de los datos
Elemento clave: datos
Se identifica info. importante
Evaluación
Evaluación de resultados
Se definen sig. pasos
Revisión de procesos
Preparación de los datos
Se revisa si los datos almacenados son correctos
Se puede excluir o agregar info.