Please enable JavaScript.
Coggle requires JavaScript to display documents.
商务智能BI - Coggle Diagram
商务智能BI
:star:商务智能方法(数据挖掘)
-
-
三、关联
1、频繁项集的概念
2、支持度、置信度概念,怎么算
3、 :star:apriori算法(FP-Growth不考)
主要步骤、(剪枝)知道怎么做,书上以及PPT上的例题那种能自己手动做出来
4、剪枝、剪裁规则
5、生成关联规则:负关联规则、负模式
6、其他度量方式也要会算
六、聚类(掌握)
1、基本概念:聚类的分类、聚类的方法分类
2、基于内容的相似度:相似度怎么算 皮尔逊、Jaccard、计算相似度的步骤
3、K均值:质心怎么计算,怎么运用;适用的场景。和层次聚类的区别
4、层次聚类:应用场景、步骤、优点
每个算法的优缺点和适用场景,这非常重要
-
商务智能概念及过程
:star:P6 BI系统的构成(6个):数据源、数据仓库、联机分析处理OLAP、数据探查、数据挖掘、业务绩效管理
:check:数据挖掘中进一步分为: 分类(预测类别 定性属性)、聚类、关联分析、数值预测、
(下面是在15章BI的深度应用与发展)序列分析、社会网络分析
-
-
数据仓库与数据库
-
2、区别:构建目的、管理的数据、管理方法都不同
-
(2)管理的数据不同:数据库通常只包含当前数据,数据的存储尽量避免冗余,数据的组织根据业务过程涉及的数据实现;且数据是最细节的数据。数据仓库中的数据是按照主题组织的,将某一主题的所有数据集成在一起,数据存在大量冗余;且通常是历史数据。
(3)管理方法不同:数据库中的数据需要进行频繁的插入、删除、修改等更新操作,需要复杂的并发控制机制保证事务运行的隔离性,对数据的时效性、完整性及事物吞吐量要求很高。数据仓库中的数据主要用于分析处理,除了初始的导入和成批的数据清除操作之外,数据很少需要更新操作。通常是对海量历史数据的查询和分析,要访问的数据量非常大,数据质量非常关键。