天池比賽打卡

2021-10-05 01:15:54 字數 497 閱讀 7307

1.線性回歸模型

線性回歸對於特徵的要求;

處理長尾分布

理解線性回歸模型

2.模型效能驗證

評價函式與目標函式

交叉驗證方法

留一驗證方法

針對時間序列問題的驗證

繪製學習曲線

繪製驗證曲線

3.嵌入式特徵選擇

lasso回歸

ridge回歸

決策樹4.模型對比

常用線性模型

常用非線性模型

5.模型調參

貪心調參方法

網格調參方法

貝葉斯調參方法

小結線性回歸模型的資料集要盡量調整成正態分佈;

用時間靠前的4/5樣本當作訓練集,時間靠後的1/5當作驗證集,結果和五折交叉驗證差距不大;

線性回歸,ridge和lasso模型對比,前兩個較好,但ridge的coef引數很多較大,抗擾動弱;

常用模型中,隨機森林模型表現最好,lgbm二好;

DataWhale天池比賽 Task5

常見的整合學習方法有stacking bagging和boosting,同時這些整合學習方法與具體驗證集劃分聯絡緊密。由於深度學習模型一般需要較長的訓練週期,如果硬體裝置不允許建議選取留出法,如果需要追求精度可以使用交叉驗證的方法。那麼在10個cnn模型可以使用如下方式進行整合 dropout經常出...

天池新聞推薦比賽3 多路召回

具體 過多,詳情見 採用不同的召回策略,分別召回商品集,然後再進行排序。下圖是多路召回的示意圖 本次比賽採取的多路召回為5路召回,分別是 基於使用者的召回 由兩層深度網路組成,先粗排,然後再精排。基本架構如下 具體的原理見王喆的部落格 重讀youtube深度學習推薦系統 字字珠璣,驚為神文 4 yo...

Sixth day阿里雲天池打卡之集合與序列

一.今日學習內容概括 整體學習了集合與序列 二.具體學習內容 a 集合的建立 訪問值 內建方法 轉換 凍結 內建方法 許多函式的應用,包括add update remove discard pop intersection union difference symmetric issubset is...