1>。系統首先會根據使用者的屬性建模,比如使用者的年齡,性別,興趣等資訊。根據這些特徵計算使用者間的相似度。比如系統通過計算發現使用者a和
c比較相似,就會把
a喜歡的物品推薦給c。
優勢: a
不需要歷史資料,沒有冷啟動問題
b 不依賴於物品的屬性,因此其他領域的問題都可無縫接入。
不足:演算法比較粗糙,效果很難令人滿意,只適合簡單的推薦
2>
基於內容的推薦:使用物品本身的相似度而不是使用者的相似度。系統首先對物品的屬性進行建模,實際應用中,只根據型別顯然過於粗糙,還需要考慮演員,導演等更多資訊。通過相似度計算,發現電影a和
c相似度較高,因為他們都屬於愛情類。系統還會發現使用者
a喜歡電影
a,由此得出結論,使用者
a很可能對電影
c也感興趣。於是將電影
c推薦給a。
優勢:對使用者興趣可以很好的建模,並通過對物品屬性維度的增加,獲得更好的推薦精度
不足: a
物品的屬性有限,很難有效的得到更多資料 b
物品相似度的衡量標準只考慮到了物品本身,有一定的片面性 c
需要使用者的物品的歷史資料,有冷啟動的問題
3>
基於關聯規則
的推薦:
主要是挖掘一些資料的依賴關係,典型的場景就是
「購物籃問題
」,通過關聯規則的挖掘,我們可以找到哪些物品經常被同時購買,或者使用者購買了一些物品後通常會購買哪些其他的物品。
4>協同過濾:是利用集體智慧型的乙個典型方法(如果你現在想看個電影,但你不知道具體看哪部,你會怎麼做?大部分的人會問問周圍的朋友,看看最近有什麼好看的電影推薦,而我們一般更傾向於從口味比較類似的朋友那裡得到推薦)。
三步驟:收集資料(使用者的歷史行為資料)
——找到相似使用者和物品(計算使用者間以及物品間的相似度)
——進行推薦(分為基於使用者、基於物品的協同過濾)
基於使用者的協同過濾
——基於使用者屬性的推薦比較
都是計算使用者的相似度,並基於「鄰居
」使用者群計算推薦,但它們所不同的是如何計算使用者的相似度,基於使用者屬性的機制只考慮使用者本身的特徵,而基於使用者的協同過濾機制可是在使用者的歷史偏好的資料上計算使用者的相似度,它的基本假設是,喜歡類似物品的使用者可能有相同或者相似的口味和偏好。計算上,就是將乙個使用者對所有物品的偏好作為乙個向量來計算使用者之間的相似度。
‚ 基於物品的協同過濾
——基於內容的推薦比較
都是基於物品相似度**推薦,只是相似度計算的方法不一樣,前者是從使用者歷史的偏好推斷,而後者是基於物品本身的屬性特徵資訊。計算上,就是將所有使用者對某個物品的偏好作為乙個向量來計算物品之間的相似度,得到物品的相似物品後,根據使用者歷史的偏好**當前使用者還沒有表示偏好的物品,計算得到乙個排序的物品列表作為推薦。
對於物品
a,根據所有使用者的歷史偏好,喜歡物品
a的使用者都喜歡物品
c,得出物品
a 和物品
c 比較相似,而使用者
c 喜歡物品
a,那麼可以推斷出使用者
c 可能也喜歡物品c。
item cf
從效能和複雜度上比
user cf
item cf
的推薦成為了引導使用者瀏覽的重要手段。
ƒ 基於模型的協同過濾推薦
基於樣本的使用者喜好資訊,訓練乙個推薦模型,然後根據實時的使用者喜好的資訊進行**,計算推薦。
協同過濾的優勢: a
它不需要對物品或者使用者進行嚴格的建模,而且不要求物品的描述是機器可理解的,所以這種方法也是領域無關的。 b
這種方法計算出來的推薦是開放的,可以共用他人的經驗,很好的支援使用者發現潛在的興趣偏好
不足: a
方法的核心是基於歷史資料,所以對新物品和新使用者都有
「冷啟動
」的問題。 b
推薦的效果依賴於使用者歷史偏好資料的多少和準確性。 c
在大部分的實現中,使用者歷史偏好是用稀疏矩陣進行儲存的,而稀疏矩陣上的計算有些明顯的問題,包括可能少部分人的錯誤偏好會對推薦的準確度有很大的影響等等。 d
對於一些特殊品味的使用者不能給予很好的推薦。 e
由於以歷史資料為基礎,抓取和建模使用者的偏好後,很難修改或者根據使用者的使用演變,從而導致這個方法不夠靈活。
5>混合推薦機制
1.
加權的混合(
weighted hybridization):
用線性公式(
linearformula
)將幾種不同的推薦按照一定權重組合起來,具體權重的值需要在測試資料集上反覆實驗,從而達到最好的推薦效果。
2.
切換的混合(
switching hybridization
):前面也講到,其實對於不同的情況(資料量,系統執行狀況,使用者和物品的數目等),推薦策略可能有很大的不同,那麼切換的混合方式,就是允許在不同的情況下,選擇最為合適的推薦機制計算推薦。
3.
分割槽的混合(
mixed hybridization
amazon
4.
分層的混合(
meta-level hybridization):
採用多種推薦機制,並將乙個推薦機制的結果作為另乙個的輸入,從而綜合各個推薦機制的優缺點,得到更加準確的推薦
推薦系統評價 NDCG方法概述
摘要 哪一種模型更適合挖掘資訊,主要的決策因子是推薦質量,而推薦系統包括很多很棘手的問題,下面就由這篇文章帶給大家推薦系統評價。編者按 在資訊過剩的網際網路時代,推薦系統的地位隨著大資料的普及愈發重要。評估乙個推薦模型的質量面臨很多棘手的問題,我們常用的指標是直接的準確率 召回率,但準確率不一定具有...
推薦系統架構 推薦系統(1) 業界推薦系統架構
1.1業界主流推薦系統架構 業界推薦系統通用架構 1.2使用者本身資料 1.3物品本身資料 1.4使用者行為資料 2.1基於離線訓練的推薦系統架構設計 常用演算法 邏輯回歸 logistics regression 梯度提公升決策樹 gbdt 和因式分解 fm 架構設計 2.2面向深度學習的推薦系統...
推薦系統(1) 推薦系統概述
推薦系統是主動從大量資訊中找到使用者可能感興趣的資訊的工具。推薦系統的核心問題是如何實現推薦個性化 如何向使用者推薦匹配度高的產品 商品 或專案,本質是通過一定的方式將使用者和專案聯絡起來。自從xerox palo alto研究中心於1992年研發出了基於協同過濾的實驗系統tapestry以來 主要...