Please enable JavaScript.
Coggle requires JavaScript to display documents.
Lec 3, Dimensional Modelling, Summary - Coggle Diagram
Lec 3
Dimensional Modelling
数据仓库(Data Warehouse, DW)特点
Subject-Oriented:按主题组织,如销售、顾客、产品
Integrated:整合多系统数据,标准格式
Time-Variant:保存历史快照,可追踪变化
Non-Volatile:只读,定时更新(非实时)
Granularity:数据存储多个粒度(粗略→细节)
设计流程(Kimball 方法)
选择业务过程(如销售、借阅)
定义粒度(最小分析单元)
确定维度(客户、时间、产品等)
确定度量指标(销售额等)
完善维度表(包含层级和属性)
维度建模 Dimensional Modelling(Kimball模型)
目标
优化查询性能,而非更新性能
简单易懂,便于终端用户写查询
结构组成
Fact Table(事实表):包含度量指标(如销售额)+ 各维度外键
Dimension Table(维度表):提供查询切入维度(如产品、时间、客户、门店)
Star Schema(星型模型)
中心是事实表
四周是维度表:What(产品)、When(时间)、Who(客户)、Where(门店)
Transactional vs. Informational Databases
事务型数据库 Transactional
支持日常操作(下单、发货),高度规范化(避免冗余),读写频繁,一线员工,
事务型数据库像收银机系统,记录每笔交易
信息型数据库 Informational
支持分析决策(趋势分析),非规范化(便于分析),查询为主,管理者、分析师
信息型数据库像大屏仪表盘,分析每家门店的销售趋势
事实表(Fact Table)
包含可加性指标(如销售额、销量)
每条记录粒度 = 每维度中最细粒度
维度表(Dimension Tables)
每张维度表描述某个分析方向
维度内通常存在层级结构(Hierarchies)
事务型 vs. 分析型查询对比
事务型查询 Transaction Query
顾客电话是多少?哪家门店今天开门?
分析型查询
哪类客户带来最多销售额?哪个季度的营业额最高?
规范化 vs 非规范化
规范化
多表少冗余,更新一致性强,设计复杂
非规范化
少表快查询,查询响应快,用户友好
数据仓库更适合使用非规范化结构(如星型模型)
Summary
Transactional vs. Informational
Data Warehouse 特征
Fact & Dimension Tables
Star Schema 星型模型
Dimensional Design 流程
粒度 & Hierarchies
正规化 vs 非正规化