推薦系統-關聯挖掘演算法實戰
1.基於知識的推薦方法簡介
2.關聯規則演算法引入
3.關聯分析問題定義
項集 支援度計數
支援度和置信度
為什麼需要使用支援度和置信度?
置信度可以用於選擇關聯規則
如何挖掘關聯規則?
4.apriori演算法詳解
演算法特點:
演算法改進:
演算法應用場景
5.候選集的產生和剪枝與支援度計數
6.apriori規則產生
7.apriori案例補充
8.apriori原始碼梳理與講解
產生關聯規則
9.fp-growth演算法引入
fp-growth演算法
10.fp-growth樹表示
11.fp-growth演算法頻繁項集產生方法
演算法總結:
fp樹中產生頻繁項集需要掃瞄幾次資料庫?
如何從fp樹中挖掘頻繁項?
12.fp-growth演算法案例講解
13.fp-growth演算法原始碼梳理
14.spark頻繁模式挖掘實踐
import org.apache.spark.sql.sparksession
import org.apache.spark.ml.fpm.fpgrowth
/** * created by zhao-chj on 2018/11/13.
*/object fpgrowth }
15.基於spark的fp-growth演算法專案實戰
資料處理:
演算法建模
演算法**:
16.mlxtend 庫實戰apriori 演算法(了解)
17.頻繁項集的關聯規則生成(了解)
推薦系統 關聯規則挖掘
購物籃分析 關聯規則挖掘,頻繁規則挖掘 挖掘資料集 事務資料集,交易資料集 購物籃資料 頻繁模式 頻繁地出現在資料集中的模式,例如項集,子結構,子串行等 挖掘目標 頻繁模式,頻繁項集,關聯規則等 關聯規則 牛奶 雞蛋 支援度 2 置信度 60 支援度 分析中的全部事物的2 同時購買了牛奶和雞蛋 置信...
推薦系統7 推薦演算法實戰 mahout推薦演算法框架
1.1概述 1.2發展歷史 mahout一直伴隨hadoop發展的,從一開始能夠幫助我們在hadoop上實現很多機器學習,到後來發現它的效率越來越慢,於是放棄使用了一段時間,在一年之後,大概14年開始宣布 0.9版本 截止14年底,mahout不再接受任何mapreduce開發的演算法,轉向spar...
推薦系統實戰
其中,r u 表示對使用者推薦的n個物品,t u 表示使用者u在測試集上喜歡的物品集合。jaccard公式 其中,n u 表示使用者u有過正反饋的物品集合。余弦相似度公式 其中,s u,k 表示和使用者u興趣最接近的k個使用者集合 n i 表示對物品i有過正反饋的使用者集合 w u,v 表示使用者u...