Apriori關聯規則演算法

2021-09-24 06:21:05 字數 613 閱讀 5659

例子:

支援度:支援度是乙個百分比,指某個商品組合出現的次數與總次數之間的比例,支援度越高表示該組合出現的機率越大。

在上面圖中我們可以發現「牛奶」出現了 4 次,那麼這 5 筆訂單中「牛奶」的支援度就是 4/5=0.8。

同樣「牛奶 + 麵包」出現了 3 次,那麼這 5 筆訂單中「牛奶 + 麵包」的支援度就是 3/5=0.6。

置信度:表示你購買了a商品後,你還會有多大的概率購買b商品。

置信度(牛奶→啤酒)=2/4=0.5,代表如果你購買了牛奶,有多大的概率會購買啤酒?

置信度(啤酒→牛奶)=2/3=0.67,代表如果你購買了啤酒,有多大的概率會購買牛奶?

我們能看到,在 4 次購買了牛奶的情況下,有 2 次購買了啤酒,所以置信度 (牛奶→啤酒)=0.5,而在 3 次購買啤酒的情況下,有 2 次購買了牛奶,所以置信度(啤酒→牛奶)=0.67。

Apriori 關聯規則演算法

關聯規則通過量化的數字描述物品甲的出現對物品乙的出現有多大的影響。它的模式屬於描述型模式,發現關聯規則的演算法屬於無監督學習的方法。其實是一種事物相關性的 通過對比支援度,進行剪枝,將支援度高的分支留下,繼續探尋關聯,直到再沒有高於最小支援度為止。應用場景比較廣泛,購物籃資料,醫療診斷,科學資料分析...

關聯規則挖掘 Apriori演算法

1 apriori 介紹 apriori演算法使用頻繁項集的先驗知識,使用一種稱作逐層搜尋的迭代方法,k項集用於探索 k 1 項集。首先,通過掃瞄資料庫,累積每個項的計數,並收集滿足最小值尺度的項,找出頻繁 1 項集的集合,該集合記做 l1 然後利用 l1 找頻繁 2 項集的集合 l2 l2 找 l...

關聯規則 Apriori演算法實現

coding utf 8 from future import print function import pandas as pd 自定義連線函式,用於實現l 到c k的連線 def connect string x,ms x list map lambda i sorted i.split ms...