推薦系統 概述

2021-09-16 12:32:46 字數 2366 閱讀 9239

好久沒有更新了!!!

最近一直在研究推薦相關的知識,也算是有一點感悟吧,暫且打算寫一系列推薦入門的文章,

一為分享,共同學習。二為對知識做乙個系統的整理。

這是第一篇,不打算說太多關於技術的問題,我們就來隨便聊聊推薦系統,然後本篇文章也作為該系列的乙個導航文章吧!

我想大家應該都對推薦系統不會陌生,不管你是逛**還是刷抖音,你都能看到推薦的存在,也是因為推薦的存在,才能讓你才海量的資訊中看到自己感興趣的東西。其實我相信大家都知道什麼是推薦系統,這裡我僅以我個人的觀點闡述一下。我們從以下兩點來說:

推薦我們可以將推薦理解為推薦演算法,也是推薦系統的核心驅動。

系統一 整套的實際可行的工具,一般的來說,推薦的系統包括 前端的展示和互動,後端的資料和服務,以及核心的推薦演算法

解決資訊過載問題,現今社會是個資訊氾濫的社會,如何在這海量資訊中找到使用者所關心的東西,就是推薦系統產生的最主要原因

發掘長尾物品的潛在價值,個人的喜歡總是有一定特異性的,很多時候,我們喜歡某模擬較偏門的物品,因為其偏門,所以想要發現並不是一件容易的事情,那麼就把它交給推薦系統把。

根據28法則,20%的熱門物品產生 80%的利潤,過去人們也一直將精力放在發掘這20%熱門物品的價值,但是長尾理論則認為,80%的偏門物品如果能找到其正確需求使用者,其潛在價值遠大於20%的熱門物品,這80%的偏門物品我們就叫做長尾物品

怎麼做?我們從乙個簡單的例子來看

對於你的女神,想必你不會缺少她的各種資訊,比如 愛好,性格 甚至是三圍什麼的,收集資訊這步我們就省略了,但是不可否認,這是相當重要的一步

然後你可能:

2.1 去問尋求她的朋友幫助,問最近有沒有看什麼好看的電影

2.2 看一下一些影視**的排行榜

2.3 根據女神的愛好和喜歡的型別,去找一下類似的電影

2.4 總之,你要想盡一切辦法盡可能的獲取到女神可能感興趣的電影

不能一股腦的把收集到的電影進行推薦,得從你找到的電影列表中,進行篩選,你可能需要考慮,巴拉巴拉,肯定有一堆了,然後挑選出最有可能收到女神喜歡的電影進行推薦。

然後雖然你歷盡千辛萬苦給女神推薦了,她真的會喜歡嗎?所以這時候你一定得看看女神得反應,說不定別人對你的推薦一臉嫌棄,這時候一定需要進行意見收集,查漏補缺。。。但是如果她很喜歡呢?說明你推薦的還不錯,很大可能下次還會找你推薦,並且對你推薦的電影會有很大的信賴感,但是。。。也就這樣啦,能不能報的美人歸可不是乙個推薦電影就能搞定滴。。。哈哈哈哈

這裡沒有涉及什麼具體的推薦演算法怎麼弄的,主要還是推薦的乙個流程:

1. 收集使用者資訊

2. 通過推薦演算法產生候選集

3. 從候選池中選取topn 進行推薦

4. 對推薦的結果進行評測,改進

推薦系統的評測在實際工作工程中可能比 推薦系統的實現更加重要 和 複雜,這一塊我們有機會後面來聊一聊,這裡僅以推薦系統實戰這本書列舉一下評測方法,大概了解一下就好,這塊不是一下就能說明白的

**準確度

**準確度度量乙個推薦系統或者推薦演算法**使用者行為的能力。這個指標是最重要的推薦系統離線評測指標,從推薦系統誕生的那一天起,幾乎99%與推薦相關的**都在討論這個指標。

這主要是因為該指標可以通過離線實驗計算,方便了很多學術界的研究人員研究推薦演算法。

一般來說,我們訓練乙個模型的時候,會將資料按一定比例分為 訓練集 和 測試集,用訓練集訓練出模型之後,將測試集代入模型模擬**,評測模型的效果

覆蓋率覆蓋率(coverage)描述乙個推薦系統對物品長尾的發掘能力。一般用 資訊熵 或者 基尼係數 來作為評測標準

多樣性使用者的興趣是廣泛的,我可能既喜歡恐怖片也喜歡喜劇片,你應該兩者兼顧而不是只考慮一種型別,我們要根據去各種興趣去做推薦,而不要只推薦某一種興趣的東西,所以也叫推薦應該多樣性。

新穎性新穎的推薦是指給使用者推薦那些他們以前沒有聽說過的物品,但是推薦的這個物品是有根據的。

驚喜度驚喜度(serendipity)一般來說是推薦那些他們以前沒有聽說過的物品,並且使用者也不知道你為什麼推薦給他,但是他還是很喜歡你這個推薦的

信任度你好朋友說你買卡宴比較好,和乙個卡宴汽車的銷售說,你買卡宴好。。。你更會信任哪個推薦?這就是信任度。

實時性2月1號,某某股神** 2月10號 x股會大漲,2月10號,x股果然大漲,然後2月11號,你把這個訊息推薦給股民。。。。然後。。。這就是實時性

健壯性好的推薦系統,要能頂的住別人的惡意攻擊,比如刷好評 刷單什麼的。。。

上面說的都是各種評測標準,但是評測的環境其實也是很重要的,同乙個模型,不同的測試環境,得出的效果可能會迥異,所以某些時候,推薦系統的模型可能不只有乙個,根據不同的 時間,使用者,或者物品 都可能用不同的模型。

推薦系統概述

物品 關注物品集的屬性和特徵 使用者 關注使用者基本屬性,年齡,性別等 事務 使用者的行為記錄,分為顯示行為和隱式行為 推薦系統的分類 基於內容 content based 為使用者推薦與過去興趣相似的物品,物品的相似性是基於被比較物品的特徵來計算的 協同過濾 cf collaborative fi...

推薦系統概述

利用使用者和物品的特徵資訊,給使用者推薦那些具有使用者喜歡的特徵的物品。利用使用者喜歡過的物品,給使用者推薦與他喜歡過的物品相似的物品。利用和使用者相似的其他使用者,給使用者推薦那些和他們興趣愛好相似的其他用 戶喜歡的物品。根據實時性分類 離線推薦 實時推薦 根據推薦原則分類 基於相似度的推薦 基於...

推薦系統(1) 推薦系統概述

推薦系統是主動從大量資訊中找到使用者可能感興趣的資訊的工具。推薦系統的核心問題是如何實現推薦個性化 如何向使用者推薦匹配度高的產品 商品 或專案,本質是通過一定的方式將使用者和專案聯絡起來。自從xerox palo alto研究中心於1992年研發出了基於協同過濾的實驗系統tapestry以來 主要...