對企業而言是解決『增長』問題,推薦系統處於『增長引擎』的位置
對使用者而言是解決資訊過載問題,在』資訊過載『的情況下如何獲得感興趣的資訊
推薦系統的基礎問題就是』人『和』資訊『的關係。
上述中的『人』,在實際過程中『人』也是各種資料。和人相關的資訊可以被稱為使用者資訊
除了使用者資訊和商品資訊,為了使推薦系統具有實時推薦的能力,基於使用者所處的時間,地點,狀態等一系列環境資訊也會對使用者選擇造成影響。統稱這類資訊為『場景資訊』或者『上下文資訊』
場景資訊和上述兩種資訊的差距在於場景資訊實時動態變化
協同過濾(cf)演算法族:
· ·協同過濾演算法從物品相似度和使用者相似度出發,衍生出兩種模型itemcf和usercf模型。為了使協同過濾擁有處理稀疏共現矩陣和更強的泛化能力,發展出了矩陣分解mf模型,並發展出矩陣分解的各個分支模型。
邏輯回歸模型族
因子分解機模型族
組合模型族
協同什麼?
協同使用者對物品的評價,反饋, 意見等資訊。
過濾什麼?
對海量資訊進行過濾。
cf具體問題?
**使用者x是否喜歡該商品a?
已知資訊儲存形式?
共現矩陣
共現矩陣?
user\item
item1
item2
item3
user1
+1-1
0user20+1
0user3-1?
+1usercf?(itemcf同理)
計算與user興趣相似的top(n)使用者,根據這些使用者計算出對目標商品的**值。(top(n)中的n為超引數)
如何計算使用者相似度?(p17)
a. 余弦相似度
b. 皮爾遜相關係數
c. 基於皮爾遜的係數引入物品平均分減少評分偏置方法
usercf的問題?
a. 需要維護使用者相似度矩陣,矩陣一般以n^2的速度隨使用者數增長
b. 使用者歷史資料往往稀疏,相似使用者準確度很低
協同過濾的問題?
處理稀疏向量的能力弱,頭部效應明顯(p20)
解決上述問題方法?
mf-矩陣分解
經典**
亞馬遜推薦系統:linden g , smith b , york j . amazon. com recommendations: item-to-item collaborative filtering[j]. ieee internet computing, 2003, 7(1):76-80.
《現代作業系統》第1章讀書筆記 引論(未完成)
現代計算機系統由乙個或多個處理器 主存 磁碟 印表機 鍵盤 滑鼠 顯示器 網路介面以及各種其他輸入 輸出裝置組成。一般而言,現代計算機系統是乙個複雜的系統。如果每位應用程式設計師都不得不掌握系統的所有細節,那就不可能再編寫 了。而且,管理這些部件並加以優化使用,是一件挑戰性極強的工作。所以,計算機安...
博弈論筆記 未完成
1 分析博弈 小紅是個遊戲迷,他和小藍一起玩拿石子遊戲。遊戲規則為2個人輪流拿石子。一次可以拿1顆或3顆,規定誰取到最後一顆石子誰就勝出。最後決定由小紅先取。兩人都是遊戲高手,該贏的絕不會輸 表示不會失誤 問在知道石子總數的情況下,怎樣快速 誰將會勝出。取石子分為3種情況 1,1 共取走2個石子 1...
軟體測試技術基礎 筆記(未完成)
軟體測試的目的即是盡可能發現軟體中的缺陷 軟體缺陷可以定義為軟體實現的遺漏 使用者需求實現遺漏 錯誤 與有使用者需求不符 多餘 額外的實現 80 的錯誤集中在20 的 中 經驗有理。1 測試分類 黑盒測試,不關注內部實現邏輯,把所有實現看成乙個黑盒子,只關注輸入和輸出,具體包括 功能測試 效能測試 ...