Please enable JavaScript.
Coggle requires JavaScript to display documents.
Data Warehouse, Fuente de consulta y más información, image Clic para ver…
Data Warehouse
Herramientas más utilizadas Las herramientas para data warehouse se clasifican en herramientas de reportes, sistemas de soporte para decisiones y cuadros de mando.
Pentaho: acelera tareas con grandes volúmenes de datos. Cuenta con soporte NoSQL, conectividad a una amplia gama de tipos de datos y herramientas de acceso, exploración y organización de fuentes de datos. Es de pago.
Oracle WareHouse Builder: admite cualquier cliente Oracle, incluye repositorio de metadatos, ofrece soporte de administración y facilita la escalabilidad.
DB2: tiene soporte NoSQL, rendimiento optimizado, funcionalidades de análisis para data warehouse, alta disponibilidad, y también compatibilidad SQL. Es de pago.
SQLServer: rendimiento rápido, herramientas de análisis predictivo, de Big Data y servicios para BI.
-
A nivel general, la arquitectura de un data warehouse se compone de cuatro grandes capas: Staging (Datos en bruto), Core (Integración de datos), Data Mart (Cubos y dimensiones de áreas temáticas) y Access (Reportes y visualización). Pero estas se pueden especificar en nueve subcapas.
Capa de fuente de datos: abarca las diferentes fuentes de datos que alimentan al data warehouse (logs, datos internos, datos de terceros, entre otros.).
Capa de extracción de datos: los datos se extraen en las fuentes, en ocasiones se limpian y luego se llevan al sistema, pero sin transformaciones importantes.
-
Capa ETL: se aplica la lógica para transformar los datos de una naturaleza transaccional a una analítica.
-
Capa de lógica de datos: hace referencia a las reglas del negocio. Estas reglas no afectan a la transformación de datos, pero afectan a los reportes.
Capa de presentación de datos: se refiere a la información que llega a los usuarios, como dashboards, gráficos, informes u otros.
Capa de metadatos: aquí reposan los datos sobre los datos. Por ejemplo información sobre modelos lógicos.
Capa de operaciones del sistema: incluye información sobre el funcionamiento del sistema, estado de las operaciones, rendimiento del sistema, historial de acceso, entre otros.
Definición
Colección de datos orientada a un determinado ámbito, integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones.
-
-
-