在剛剛畢業的時候,當時的領導就問了乙個問題——個性化推薦與精準營銷的區別,當時朦朦朧朧回答不出。現在想想,他們可以說是角度不同。精準營銷可以理解為幫助物品尋找使用者,而個性化推薦則是幫助使用者尋找物品。那麼什麼是推薦系統呢?簡單的來說,就是幫助使用者和物品聯絡起來,讓資訊展現在對他感謝興趣的使用者面前。
在網際網路最開始興起的時候,最便捷的幫助使用者的方法就是進行分類,比如當時的雅虎,hao123等等。後來網際網路興起,這種分類已經裝不下太多的資訊,於是出現了搜尋引擎,當使用者需要什麼東西的時候,可以直接主動的去獲取。而推薦系統的出現,則幫助使用者在沒有明確的目的時,根據行為歷史或者使用者資訊為使用者提供有價值的東西。
所以乙個完整的推薦系統需要包括前段的展示頁面,後台的日誌系統以及良好的推薦演算法。
4 社交網路:facebook,使用者之間的網路關係、使用者的偏好關係
5 個性化閱讀:google reader,digg
6 基於位置的服務:基於地理位置推送飯店
7 個性化郵件:幫助篩選出優先順序高的郵件
8 個性化廣告:cpm按照看到廣告的次數收費、cpc按照點選廣告的次數收費 、cpa按照最後的訂單收費,個性化推薦幫助使用者找到他們感興趣的東西;廣告推薦幫助廣告找到對他們感興趣的使用者。
主要包括:上下文廣告(通過使用者瀏覽的內容)、搜尋廣告、個性化展示
常見的推薦演算法就時基於使用者或者物品的協同過濾。
這兩種演算法都有各自的使用場景的優劣勢。
對於很多公司都是在一定規模才引入推薦系統的,這時候已經擁有了大量的使用者行為資料,做推薦演算法就很容易了。但是有一些系統想在初期就引入,這就比較困難了。因為既沒有大量的物品,也沒有太多的使用者關係,做協同過濾就很費勁了。
因此可以考慮費個性化的推薦,比如熱門排行、利用使用者的註冊資訊、社交賬號、反饋資訊等進行推薦。之後再慢慢調整..
在系統的初期也可以考慮選擇合適的物品啟動使用者的興趣,需要有比較熱門、代表性和區分行。
一般的標籤都是由三元組組成(使用者、物品、標籤)
在打標籤的時候還需要注意標籤的清理。
因為使用者的興趣是變化的,可能隨著季節的效應而變化(比如衣服、考試資料),也可能根據購買的歷史(比如你買了一樣東西,以後就再也不需要買了)。
因此時間是乙個很重要的上下文環境,另外就是地理位置,比如吃飯、逛街等等。
資料探勘:
data mining,是乙個很寬泛的概念。字面意思就是從成噸的資料裡面挖掘有用的資訊。這個工作bi(商業智慧型)可以做,資料分析可以做,甚至市場運營也可以做。你用excel分析分析資料,發現了一些有用的資訊,然後這些資訊可以指導你的business,恭喜你,你已經會資料探勘了。
機器學習:
machine learning,是電腦科學和統計學的交叉學科,基本目標是學習乙個x->y的函式(對映),來做分類或者回歸的工作。之所以經常和資料探勘合在一起講是因為現在好多資料探勘的工作是通過機器學習提供的演算法工具實現的,例如廣告的ctr預估,pb級別的點選日誌在通過典型的機器學習流程可以得到乙個預估模型,從而提高網際網路廣告的點選率和回報率;個性化推薦,還是通過機器學習的一些演算法分析平台上的各種購買,瀏覽和收藏日誌,得到乙個推薦模型,來**你喜歡的商品。
深度學習:
deep learning,機器學習裡面現在比較火的乙個topic(大坑),本身是神經網路演算法的衍生,在影象,語音等富**的分類和識別上取得了非常好的效果,所以各大研究機構和公司都投入了大量的人力做相關的研究和開發。
總結下,資料探勘是個很寬泛的概念,資料探勘常用方法大多來自於機器學習這門學科,深度學習是機器學習一模擬較火的演算法,本質上還是原來的神經網路。
推薦系統11 《推薦系統實踐》總結
在之前我也看了很多人寫的推薦系統的部落格,理論的 演算法的都有,多是個人的理解和感悟,雖然很深刻,但是對於自己而言還是不成系統,於是我參考大牛項亮編著的 推薦系統實踐 將該領域知識系統整理一遍,與大家一起學習。本系列對應的 請檢視 前面總結推薦系統常用的資料 演算法 架構等,具體內容清檢視本系列推薦...
《推薦系統實踐》讀後心得
聯絡使用者和物品,解決資訊過載問題 雅虎 dmoz hao123 將著名的 分門別類,從而方便使用者根據類別查詢 但是隨著網際網路規模的不斷擴大,分類目錄 也只能覆蓋少量的熱門 越來越不能滿足使用者的需求。谷歌亞馬遜 netflix youtube hulu 不需要使用者提供明確的需求,而是通過分析...
推薦系統實踐
實驗方法 測評指標 測評維度 使用者活躍度和物品流行度 長尾分布 一般來說,不活躍的使用者要麼是新使用者,要麼是只來過 一兩次的老使用者。那麼,不同活躍度的使用者喜歡的物品的流行度是否有差別?一般認為,新使用者傾向於瀏覽熱門的物品,因為他們對 還不熟悉,只能點選首頁的熱門物品,而老使用者會逐漸開始瀏...