•
什麼是關聯分析?
通過關聯規則挖掘事物間存在的關係,從而總結出有意義的規律,進而指導我們的決策。
•典型應用:
購物籃分析
首先,需要生產乙個頻繁項集。
這個步驟,個人認為是為了促使結果更有可信度,而不是某個典型,也是為了推出最後的強規則。
頻繁項集的「頻繁」用支援度來表示:
而「頻繁」的標準則必須由乙個閾值,如果支援度大於或等於某個閾值,那麼該項集為頻繁項集。
那麼怎麼生成頻繁項集,步驟如下:
1、生成 1-項集,然後挑出符合閾值的1-項集,得到f1集合。
2、生成2-項集:將f1中的項集兩兩組合,並保證組合後的項集中的每個1-子項集均在f1中存在,然後挑出符合閾值的2-項集,得到f2集合。
其實此過程就是
1、設定k=1,開始挑出符合閾值的k-項集,生成fk
2、然後兩兩湊合,生成k+1項集,湊合過程要求:在所有湊合結果中只取k+1-項集的集合,同時還要求該集合的所有的k-項集都在fk當中。然後挑出出開始挑出符合閾值的k+1-項集,生成f(k+1)。
3、不斷重複1、2步驟,直到只生成乙個頻繁項集。
得到頻繁項集之後,那麼就要根據就算置信度符合的的推理得到不同的強規則,置信度計算為:
這裡有個技巧,先從k-項集抽出乙個元素,然後根據以上公式算出部分規則,然後根據當前規則,推導其他的強規則,推導的原理是:
若一條關聯規則的後件為a,那麼所有以a的任一非空子集為後件的候選規則都是關聯規則。
也就是說把強規則的後件自由組合,就能推出其他規則了。
slope one 公式
例子裡,主要是用來**使用者評分的•u
為使用者集合,有
n個使用者•i
為專案集合,有
m個專案•r
ij為使用者ui
對專案i
j的打分,rpq
為需要**的打分
推薦系統 關聯規則挖掘
購物籃分析 關聯規則挖掘,頻繁規則挖掘 挖掘資料集 事務資料集,交易資料集 購物籃資料 頻繁模式 頻繁地出現在資料集中的模式,例如項集,子結構,子串行等 挖掘目標 頻繁模式,頻繁項集,關聯規則等 關聯規則 牛奶 雞蛋 支援度 2 置信度 60 支援度 分析中的全部事物的2 同時購買了牛奶和雞蛋 置信...
推薦系統 關聯規則 1
說到推薦系統,就不能不說關聯規則。基於關聯規則的推薦,是入門級的推薦技術實現,也是目前應用最廣泛的一種推薦形式。關聯規則起源於資料探勘領域,人們用它來發現大量資料中項集之間 有趣 有用 的關聯。它本身是資料探勘領域中乙個重要的研究課題,近些年來更是由於被業界廣泛應用而倍受重視。rakesh agra...
05 推薦系統 關聯挖掘演算法實戰
推薦系統 關聯挖掘演算法實戰 1.基於知識的推薦方法簡介 2.關聯規則演算法引入 3.關聯分析問題定義 項集 支援度計數 支援度和置信度 為什麼需要使用支援度和置信度?置信度可以用於選擇關聯規則 如何挖掘關聯規則?4.apriori演算法詳解 演算法特點 演算法改進 演算法應用場景 5.候選集的產生...