再理解協同過濾演算法

2022-01-24 05:34:08 字數 759 閱讀 6904

協同過濾演算法是推薦系統中最古老,也是最簡單高效的推薦演算法。簡單說協同過濾就是根據以往的使用者產生的資料分析,對使用者的新行為進行匹配分析來給使用者推薦使用者最有可能感興趣的內容。

協同過濾演算法是為了解決長尾現象,也就是說推薦系統是為了解決長尾現象而誕生的。因為在之前在有限的空間(如:書店的書架、服裝店的衣架、商店的貨架、網頁的展示區域)只能擺有限的物品進行展示,造成大量的非熱門物品很難進入人們的視野,也就無法產生任何價值。研究表明挖掘長尾內容,產生的效益很可能會超過頭部。因為網路、計算機的發展使關注大資料量下的長尾內容成本下降,使得關注長尾效益成為可能。

簡單說就是推薦系統會在有限空間內針對到單個使用者推薦內容,幫助使用者發現長尾內容中對自己更有價值的內容,發揮長尾內容的效益。也就是推薦演算法和推薦系統的存在價值。

協同過濾演算法的數學模型有乙個假設前提:

每個人會有乙個或多個自己感興趣的領域。

看起來有點廢話,但是這是一切的基礎,這樣我們可以推論:

1、如果兩個事物同屬於乙個人的興趣範圍,那麼這兩個事物有較大可能屬於不同型別的事物;

2、如果兩個事物同時屬於很多人的興趣範圍,那麼這兩個事物有較大可能屬於同一型別的事物。

1、不活躍使用者應該比活躍使用者有更多的權重來確定物品相關性,因為活躍使用者總會對很多事物點讚之類的,即使他只是感覺差不多而已。

2、對熱門事物的懲罰力度、推薦事物的新穎度等控制,都是乙個需要試驗後設定好乙個理想的閾值。

3、最後還需要根據推薦系統所推薦的事物,進行各種資料的優化和過濾以滿足產品定位的各種需求。

參考: 推薦系統實踐

協同過濾演算法

3種形式的協同過濾 collaborative filtering 演算法 1 user based 相同 相似 使用者的喜好相同 2 item based 能夠引起使用者興趣的專案,必定與其之前評分高的專案相似 3 model based 先用歷史資料得到乙個模型,再用此模型進行 參考 這個位址是...

協同過濾演算法

1.表示使用者行為矩陣,即統計使用者購買某種商品型別的數量 public double getnumbycustomer customer customer return vectore 2.用余弦距離計算每個使用者與其它使用者的行為相似度 下面 是兩個使用者之間的相似度,進行遍歷就可以獲取全部相似...

協同過濾演算法

乙個人想看電影的時候常常會思考要看什麼電影呢。這個時候他可能會問周圍愛好的人求推薦。現在社會每天都會產生海量的資訊。面對這麼多資訊好多人都不知道什麼資訊是自己需要的。推薦系統正是起了這麼乙個作用。推薦系統的應用隨處可見。網路購物是乙個典型的例子,電子商務的運營商往往會根據使用者在 的行為推薦使用者可...