Please enable JavaScript.
Coggle requires JavaScript to display documents.
關聯分析法 - Coggle Diagram
關聯分析法
生活中常見的關聯運用
蝦皮買賣推薦
博客來買書推薦
PChome購物推薦
關聯規則
依據
以資料找出頻繁出現的項目組合
又稱購物籃分析
範例
尿布啤酒
美國週末的娛樂最常在家裡觀看球賽,所以爸爸在買尿布的時候就㇐起買啤酒
故購買尿布的人有70%購買啤酒,這個關聯則不易理解
星期五的晚上,年輕的爸爸常被太太要求下班後去超級市場買小嬰兒的尿布回家
衡量基礎-指標公式 :
Confidence信賴度
在A出現下,B出現的機率
同時購買A和B的訂單數/購買A的訂單數
Lift提升度
買A同時買B和單獨買A與單獨買B相較,好多少
Support/[(購買A的次數/總購買訂單數)*(購買B的次數/總購買訂單數)]
Support支持度
同時包含A與B的交集機率
同時購買A和B的訂單數/總購買訂單數
目標
兩種形式
頻繁項集
經常出現在㇐起的物品的集合
關聯規則
暗示兩種物品之間可能存在很強的關係
在大量資料中尋找相互關係的任務
(Lift)的計算
買A同時買B和單獨買A與單獨買B相較,好多少
提升度= 1 : 表示兩數據獨立,不相關
提升度< 1 : 表示兩數據呈負相關
提升度> 1 : 表示數據間越相關,呈正相關
提升度
Lift=5(啤酒和尿布組合在㇐起賣,可以提升5倍)
代表提升度大於1,即啤酒與尿布是正關聯,表示預期結果比隨機發生
㇐條關聯規則在預測結果時能比隨機發生的機會好多少,也就是這個規則比隨機猜測的準確度提升量
結論:尿布搭配啤酒銷售,比單獨只銷售尿布好
Apriori
特性
如果有㇐個集合不是頻繁的話,則它的母集合也㇐定不是頻繁的
若㇐項目集是頻繁的,則它的所有非空子集合也必定是頻繁的
原理
即某個項集是頻繁的,那麼它的所有子集也是頻繁的。