一晃半年。。。看了很多專案,自己摸索了很長時間,也接手了搜尋系統,得到了一些新的經驗,下面都是些不高大上的實用套路技巧,做業務的同學可能會感覺對搜尋推薦廣告系統很感興趣但不知如何入門。
我極其討厭某些大廠某些高工有套路卻不共享,整些高大上的ppt演算法數學唬人,讓大家入不了門,mmp。所以這裡與大家共享這些入門套路經驗。還是那句話,有問題請盡情噴,我喜歡交流。
推薦的召回策略可以組合svd,itemcf,usercf,knn等多種演算法,大家有啥上啥不要慫。至於召回策略和每種演算法的召回商品數量,人肉拍乙個夠用了。實時推薦根據實時行為商品召回,本質上和離線計算推薦沒什麼不同。#7-7補充:根據使用者畫像裡面的使用者偏好屬性召回,本質上和搜尋的意圖分析差不多,這就是個性化推薦的屬性擴充套件。搜尋推薦本質上很相似。
搜尋的召回,要query分析後召回多頁內容以進行下面的多輪精排序,召回多頁為了盡量保證前幾頁內容的ctr,cvr。
2.排序:
粗排之後多輪精排序,搜尋根據相似性召回根據相似性粗排,ctr*cvr模型做一輪精排,之後各種業務策略多輪精排序以針對不同的業務場景,如類目合併,品牌加權等等。
3.模型:
xgboost+liblinear+sklearn夠用,想上深度學習搜wide&deep。onlinelearning:ftrl。
4.nlp:
搜尋的精華在query分析和rerank,其中query分析需要比較實用的套路nlp技術。給大家個套路思路。感興趣搜「查詢改寫「。
推薦一些Python入門書籍
入門讀物 python基礎教程 python學習手冊 python程式設計 python cookbook python程式設計 modern python cookbook 高階讀物 python核心程式設計 流暢的python effective python 編寫高質量python 的59個有...
python的一些推薦
看到未名的幾篇帖子 使我想起了和python的一些經歷,於是寫了一篇咚咚。1 書籍 python的syntax足夠簡單,semantics也不複雜,不怎麼會使人混亂,一般來說看自帶的文件足夠可以學習了,看完兩章便可以寫出一些non trivial的程式了。硬要說入門書籍。learning in py...
業務安全的一些例項
之前在部落格寫的一篇文章,但是部落格好久沒弄了。網域名稱忘記續費了。也懶的折騰,放在省心點吧,剛仔細看了一下之前寫了,覺得自己寫的好low,等我有空在整理一些案例。近期做的一些業務安全方面的測試,其實毫無技術含量,就是想總結一下經常測試的點以及遇到的奇葩問題。1.p2p常見邏輯漏洞 加車 下單 結算...