知乎是如何個使用者推薦問題的?底層用到的演算法是什麼?

2021-09-11 20:54:50 字數 806 閱讀 3631

也是初次學習,以後還會繼續增補

推薦系統是一種在電商、廣告、內容等網際網路平台發揮著巨大價值的資料探勘產品形態。它可以提高使用者粘性、提高使用者商業轉化行為,一款好的推薦系統樂意明顯有效的提公升平台的經濟效益。

協同過濾演算法:

協同過濾演算法是一款經典的推薦演算法,也是推薦系統入門最好的機器學習演算法。協同過濾演算法主要可以分為兩類:基於使用者相似性的usercf演算法以及基於物品相似性的itemc演算法。這兩類演算法的基本思想是:

(1)如果user1和user2的相似度高,那麼user1買了一款物品item,就可以把這款物品推薦給user2,這是usercf的基本思想。

(2)如果item1與item2相似度高,使用者user買了item1,就可以推薦他再買item2.這也是itemcf的基本思想。

知乎內容的根基在於它由一棵幾萬個甚至更多的話題組成的有向無環圖的話題網路,每乙個問題都可以對映到幾個話題標籤上。如果單標籤的角度入手,考慮基於這些標籤內在的層級聯絡,根據標籤的相似度來計算標籤組的相似度以此來衡量問題間的相似度,這樣的實現過於複雜。而協同過濾演算法的強大之處在於:不用考慮問題間的層級聯絡(內在聯絡),只要基於大量使用者的行為資料,就可以衡量這些問題在大量使用者中被傾向的相似度。

itemcf演算法計算過程

以」使用者關注「為例(因為知乎中使用者的行為唯度較多,比如提問、收藏等等)

(1)計算問題之間的相似度

所以我們計算n個問題兩兩之間的相似度就可以轉化為乙個對角線為0的對稱鄰接矩陣,最少需要計算n(n-1)/2次

知乎爬蟲入門問題如何解決

眾所周知,爬取知乎真的不簡單。閒話少說,直接上不太正確的源 coding utf 8 import requests import json as json import pandas as pd import time import re headers url user data def get...

以知乎為例子來說明MVC是個啥

記得當時了解web開發的mvc model view controller 模式後,有一種心血噴湧的感覺,覺得太有意思了 程式設計師別噴,我就是這麼沒見過世面 我們以知乎為例子來說明mvc是個啥 每個人的主頁都是相同的布局和風格,例如最上面的選單搜尋欄,顏色分割,左邊顯示動態等,右邊是個人資訊等,然...

如何解決知乎引流常見問題,獲得平台推送

從事網際網路營銷的人都知道,軟文營銷是所有營銷中最有效果的一種方式,只要文章不刪,那麼可以持續不斷的為產品帶來流量。與硬廣告相比,軟文之所以叫做軟文,精妙之處就在於乙個軟字,讓使用者不受強制廣告的宣傳下,文章內容與廣告的完美結合,從而達到廣告宣傳的效果,在營銷界,一篇好的軟文價值是上千萬的 軟文的本...