推薦系統實戰第六章 利用社交網路資料

2021-10-07 13:45:14 字數 1824 閱讀 2063

推薦系統實戰第六章 | 利用社交網路資料

1、獲得社交網路資料的方式

1)電子郵件。電子郵箱的字尾,是都來自同乙個組織、公司等。

2)使用者註冊資訊。使用者在哪家公司工作、學習過等。**的社交網路資料。

3)使用者的位置資料。ip位址、gps資料

4)論壇和討論組。是否對同樣的事情感興趣。

5)即時聊天工具。

6)社交網路。社會圖譜和興趣圖譜。

2、社交網路資料簡介

社交網路資料型別

1)雙向確認的社交網路資料。

2)單項關注的社交網路資料。

3)基於社群的社交網路資料。豆瓣小組、**資料集、同一家公司工作、同一家學校畢業。

社交網路資料中的長尾分布

1)社交網路中影響力大的使用者佔少數

2)在乙個社交網路中,關注很多人的使用者佔少數,絕大多數使用者只關注很少的人。

3、基於社交網路的推薦

社會化推薦的優點

1)好友推薦可以增加推薦的信任度

2)社交網路可以解決冷啟動問題。

3.1 基於鄰域的社會化推薦演算法

3.2 基於圖的社會化推薦演算法

對實體之間的聯絡,進行圖形化的表示。對他們之間的關係,進行連線和權重分配。在利用基於圖的推薦演算法給使用者推薦物品。

3.3 實際系統中的社會化推薦演算法

基於鄰域的社會化推薦演算法需要反覆的計算和拉去資料庫,導致計算時間長,反應速度慢。

引用twitter的架構,搬到社會化推薦系統中,實現方式如下:

1)為每個使用者維護乙個訊息佇列,儲存他的推薦列表

2)使用者喜歡乙個物品時候,將(物品id、使用者id和時間)記錄寫入關注該使用者的推薦列表訊息佇列中

3)當使用者訪問推薦系統時,讀推薦列表訊息佇列,對於訊息佇列中的每個物品,重新計算物品的權重。權重的計算包括物品在佇列**現的次數,對應的使用者、熟悉程度和時間戳。同時,計算出每個物品被哪些好友喜歡過,用這些好友作為物品的推薦解釋。

3.4 社會化推薦系統和協同過濾推薦系統

在人群中做實驗比較了兩個演算法的表現,結論是沒有採取雙盲實驗,具體的應用需要做ab測驗,而且需要在實際應用中體會。

3.5 資訊流推薦

4、給使用者推薦好友

4.1 基於內容的匹配

常用的內容屬性

1)使用者人口統計學屬性,包括年齡、性別、職業、畢業學校和工作單位等

2)使用者的興趣,包括使用者喜歡的物品和發布過的言論等

3)使用者的位置資訊,包括使用者的住址、ip位址和郵編等

4.3基於社交網圖的好友推薦

社交分為有向社交和無向社交。分別為社交網路圖中使用者指向其他好友的集合,和社交網路圖中指向使用者的使用者的集合。具像化可以想象微博中的關注與被關注關係。

1)用關注共同好友比例計算兩個使用者之間的相似度

2)用被關注共同好友比例計算兩個使用者之間的相似度

3)融合關注與被關注:使用者u關注的使用者中,有多大比例也關注了使用者v。

離線實驗

史丹福大學的大規模網路資料集,有向圖。可以用於測試不同好友推薦演算法的效能。

9份訓練集,1份測試集。

用召回率和準確率為指標來衡量演算法的效能。

4.4 基於使用者調查的好友推薦演算法對比

實驗證明:

sona(利用大量使用者資訊建立了ibm員工之間的社交網路)>socialbased(基於社交網路,給使用者推薦好友的好友作為好友)> interest+social(融合interest和social)> interestbased(給使用者推薦和他興趣相似的使用者作為好友)

第六章 網路配置

路由器的工作原理 1 路由器接收來自它連線的某個 的資料。2 路由器將資料向上傳遞。3 路由器檢查ip頭部中的目的位址,如果目的位址位於發出資料的那個網路,那麼路由器就放下被認為已經達到目的地的資料。4 如果資料要送往另乙個網路,那麼路由器就查詢路由表,以確定資料要 到的目的地。5 路由器確定哪個介...

linuxC程式設計實戰 第六章

函式宣告 int atoi const char nptr 標頭檔案 include 函式說明 將字串轉換成整數.例如 atoi 777 這個函式怎麼這麼好用呢 以前竟然不知道 exit 0 正常執行程式並退出程式 exit 1 非正常執行程式導致程式退出 return 返回函式,若在非主函式中,則...

第六章 實戰篇

這一章講的是驅動程式開發步驟,從一開始我們都知道linux的驅動的工作方式是將每乙個驅動都對映成乙個檔案。這些檔案就是驅動檔案,都儲存在 dev目錄下。因此,我們做驅動開發程式,就可以通過與檔案進行互動了。編寫linux驅動程式的步驟應該分為一下幾大步 1 裝載和解除安裝linux驅動 2 註冊和登...