推薦系統中的常用演算法 DeepWalk演算法

通過graph embedding得到圖中每個item的embedding表示，deepwalk演算法常被用於推薦系統。graph embedding使用低維稠密向量的形式表示圖中的節點，使得在原始圖中相似（不同的方法對相似的定義不同）的節點其在低維表達空間也接近。

deepwalk演算法借鑑了word2vec演算法的思想，word2vec是nlp中一種常用的word embedding方法，word2vec通過語料庫中的句子序列來描述詞與詞的共現關係，進而學習到詞語的向量表示。deepwalk演算法與word2vec類似，使用圖中節點與節點的共現關係來學習節點的向量表示。在deepwalk中通過使用隨機遊走(randomwalk)的方式在圖中進行節點取樣來模擬語料庫中的預料，進而使用word2vec的方式學習出節點的共現關係，其具體過程如下圖所示：

具體過程為：

抽取使用者的行為序列，如圖中(a)所示；

將使用者的行為序列轉換成圖的表示方法，如圖中(b)所示；

使用skip-gram學習出節點的embedding表示，如圖中(d)所示。

deepwalk演算法思想具體過程如下所示：

randomwalk是一種可重複訪問已訪問節點的深度優先遍歷演算法。給定當前訪問起始節點，從其鄰居中隨機取樣節點作為下乙個訪問節點，重複此過程，直到訪問序列長度滿足預設條件。假設圖為g=(

v,e)

g=\left ( v,e \right )

g=(v,e

)，其中，v

vv表示圖中點的集合，e

ee表示圖中邊的集合，在randomwalk中關鍵的問題是如何計算從節點v

iv_i

vi跳轉到節點v

jv_j

vj的概率p(v

j∣vi

)p\left ( v_j\mid v_i \right )

p(vj∣

vi)：p(

vj∣v

i)=\frac}m_} & \text v_i\in n_+\left ( v_i \right ) \\ 0 & \text e_\notin e \end

p(vj∣

vi)

mij

是節點v

iv_i

vi到節點v

jv_j

vj的邊的權重，對於無向無權圖mij

=1m_=1

mij=1

。randomwalk的**大致如下：

def
deep_worker
(self)
:for _ in
range
(self.nums)
:for node in self.g.nodes():
)def
random_walker
(self, first_node)
:	series =
[first_node]
for _ in
range(1
, self.walk_length)
:		nodes_list =
list
(self.g.adj[first_node]
)        first_node = random.choice(nodes_list)
return series

from gensim.models import word2vec
w2v_model = word2vec(walks,sg=
1,hs=
1)

推薦系統中的常用演算法 DeepWalk演算法

推薦系統推薦系統的常用演算法概述

推薦系統的常用演算法

推薦系統常用演算法

推薦系統中的常用演算法 DeepWalk演算法

推薦系統 推薦系統的常用演算法概述

推薦系統的常用演算法

推薦系統常用演算法

相關推薦

推薦系統推薦系統的常用演算法概述