具體**過多,詳情見:
採用不同的召回策略,分別召回商品集,然後再進行排序。下圖是多路召回的示意圖:
本次比賽採取的多路召回為5路召回,分別是:
基於使用者的召回
由兩層深度網路組成,先粗排,然後再精排。基本架構如下:
具體的原理見王喆的部落格:
重讀youtube深度學習推薦系統**,字字珠璣,驚為神文 4
youtube深度學習推薦系統的十大工程問題
分為文章冷啟動和使用者冷啟動
1.文章冷啟動
2.使用者冷啟動
平台的新使用者,該使用者沒有點選日誌。也可能基於embedding召回。
天池比賽打卡
1.線性回歸模型 線性回歸對於特徵的要求 處理長尾分布 理解線性回歸模型 2.模型效能驗證 評價函式與目標函式 交叉驗證方法 留一驗證方法 針對時間序列問題的驗證 繪製學習曲線 繪製驗證曲線 3.嵌入式特徵選擇 lasso回歸 ridge回歸 決策樹4.模型對比 常用線性模型 常用非線性模型 5.模...
DataWhale天池比賽 Task5
常見的整合學習方法有stacking bagging和boosting,同時這些整合學習方法與具體驗證集劃分聯絡緊密。由於深度學習模型一般需要較長的訓練週期,如果硬體裝置不允許建議選取留出法,如果需要追求精度可以使用交叉驗證的方法。那麼在10個cnn模型可以使用如下方式進行整合 dropout經常出...
阿里天池比賽報告的一點總結
阿里天池比賽報告 比賽題目 在商場內精確的定位使用者當前所在店鋪,當使用者在商場環境中開啟手機的時候,存在定位訊號不准 環境資訊不全 店鋪資訊缺失 不同店鋪空間距離太近等等挑戰。出題方提供了2017年8月大概100家商場的詳細資料,包括使用者定位行為和商店等資料 已脫敏 要求通過對資料的分析處理來對...