協同過濾(collaborative filtering,簡稱cf)推薦演算法的主要功能是**和推薦,「人以類聚,物以群分」。可以分為兩類,分別是基於使用者的協同過濾演算法(user-based collaborative filtering),和基於物品的協同過濾演算法(item-based collaborative filtering)。
基於使用者的協同過濾演算法(user-based collaborative filtering)
如果a,b兩個使用者都購買了x,y,z三本圖書,並且給出了5星的好評。那麼a和b就屬於同一類使用者。可以將a看過的圖書w也推薦給使用者b。
如何通過使用者對不同商品的態度和偏好尋找相似的使用者。
用散點圖表示
歐幾里德距離評價
皮爾遜相關度評價
相關係數的分類
0.8-1.0 極強相關
0.6-0.8 強相關
0.4-0.6 中等程度相關
0.2-0.4 弱相關
0.0-0.2 極弱相關或無相關
為相似的使用者提供推薦物品。
加權排序推薦,提取了相似的幾個使用者評價過的另外商品。並對不同商品的評分進行相似度加權,然後推薦給使用者。
總結:1、資料稀疏性。乙個大型的電子商務推薦系統一般有非常多的物品,使用者可能買的其中不到1%的物品,不同使用者之間買的物品重疊性較低,導致演算法無法找到乙個使用者的鄰居,即偏好相似的使用者;2、演算法擴充套件性。最近鄰居演算法的計算量隨著使用者和物品數量的增加而增加,不適合資料量大的情況使用。
基於物品的協同過濾演算法(item-based collaborative filtering)
如果使用者a同時購買了商品1和商品2,那麼說明商品1和商品2的相關度較高。當使用者b也購買了商品1時,可以推斷他也有購買商品2的需求。
尋找相似的物品。
用散點圖表示
歐幾里德距離評價
皮爾遜相關度計算公式
為使用者提供基於相似物品的推薦。
加權排序推薦
item-based相似度計算
基於余弦(cosine-based)的相似度
基於關聯(correlation-based)的相似度
調整的余弦(adjusted cosine)相似度
item-based**值計算
加權求和
回歸
協同過濾推薦演算法 協同過濾推薦演算法總結
推薦演算法具有非常多的應用場景和商業價值,因此對推薦演算法值得好好研究。推薦演算法種類很多,但是目前應用最廣泛的應該是協同過濾類別的推薦演算法,本文就對協同過濾類別的推薦演算法做乙個概括總結,後續也會對一些典型的協同過濾推薦演算法做原理總結。推薦演算法概述 1 基於內容的推薦 這一類一般依賴於自然語...
協同過濾推薦演算法 推薦演算法 基於協同過濾CF
前邊我們已經介紹了推薦演算法裡的基於內容的推薦演算法cb,今天我們來介紹一下基於協同的推薦演算法collaboration filtering cf 協同過濾是乙個利用群體智慧型的乙個演算法,舉乙個簡單的例子,如果放假了你想去北京玩幾天,但是不知道北京都有哪些好玩的,你會怎麼做?你可能會上網查一下的...
協同過濾推薦演算法
協同過濾推薦演算法 分為基於使用者的協同過濾推薦usercf和基於物品的協同過濾推薦itemcf。介紹見 協同過濾的實現步驟 1 指導思想 這種過濾演算法的有效性基礎在於 1 使用者偏好具有相似性,即使用者可分類。這種分類的特徵越明顯,推薦準確率越高 2 物品之間具有相似性,即偏好某物品的人,都很可...