Please enable JavaScript.
Coggle requires JavaScript to display documents.
Fundametos de data Warehousing, ¿Qué es Data Warehousing?, Aplications,…
Fundametos de data Warehousing
¿Qué es?
Es una colección de datos "orientada a un tema en específico", integrada, no volátil y variante en el tiempo
Se detalla de la siguiente manera:
Orientado a un tema específico
Integrado: consistente y homogénea
No volatil: no se elimina ni modifica
Vatiante en el tiempo: guarda solo daos virgenes
Arquitectura del data Warehouse
Fuente de datos
Enterprise Resource Planning (ERP)
Paquete de software para gestionar procesos operativos
Sistemas de información (software)
Aplicaciones compradaso desarrolladas in-house
Información estructurada (planillas y archivos)
Información no estruturada
Informacion que está en formatos no estructurados, audio, video, etc
Data Warehouse
Repositorio de información el cual se usa para fines de gestión
ETL
Los procesos de extracción, transformación y carga de datos
Herramientas de Explotación:
Con los datos ya cargador en el repositorio
Herramientas de tipo OLAP(On-Line Analytical PRocessing)
Reports/Dashboards
Herramientas de Query
Minería de Datos
¿Qué es Data Warehousing?
Proceso para construir Data Warehouse
Es una coleccion de datos orientado a temas especificos
Integrada
No volatil
Variante en el tiempo
Estrategias para desarrollar un DWH
Enfoque de Data Warehouse Corporativo
Top-down
Data sources
Staging
DWH
Data access
Data Marts
Cubes
Metodología de Bill Inmon (Padre del DWH)
Enfoque Data Mart
Bottom-up
Metodología de Ralph Kimball
(Padre del BI)
Data sources
Staging
DWH
Data access
End Users
Cubes
Arquitectura de Data Warehouse
ERP
ETL
(Extraccion, transformacion, carga)
Data Warehouse
Metadata, Summary Data, raw data
Data Mining
Olap Analysis
Reportar
Operational
sistem
CRM
Flat Files
En esta arquitectura se puede apreciar
Diversar fuente de datos
ETL
Data Warehouse o almacén de datos
Capa de explotacion
(reportes, datamining, olap)
Transformación
Procesos de Extracción
Carga de Datos
Arquiectura de un DWH en la era del Big Data
Data sources
Tradicional Sources
(RDBMS, OLTP, OLAP)
New Sources
(web logs, email, sensors, social mdia)
Enterprise Hadoop plataform
Custom Aplications
Enterprise applications
Tradicional repos
Data systems
RDBMS, OLTP, OLAP
se incorpora al ecosistema un repositorio de Big Data, para capturar datos semiestructurados o no estructurados.
Modelamiento Dimensional
Elegir el proceso de negocio
Proceso de Venta
Proceso de Compras
Proceso de Selección de Personal
Determinar la Granularidad
Definir el nivel de detalle que se desea almacenar
Depende del requerimiento del negocio y los datos
La sugerencia es comenzar a diseñar el DW al mayor nivel de detalle posible
Se puede realizar Sumarizaciones (Agregaciones)
Identificar las Métricas y Tablas de Hecho
Identificar las Dimensiones
DATA
WAREHOUSE
Aplications
Business Analytics
Estrategias para la contrucción