1.線性回歸模型
線性回歸對於特徵的要求;
處理長尾分布
理解線性回歸模型
2.模型效能驗證
評價函式與目標函式
交叉驗證方法
留一驗證方法
針對時間序列問題的驗證
繪製學習曲線
繪製驗證曲線
3.嵌入式特徵選擇
lasso回歸
ridge回歸
決策樹4.模型對比
常用線性模型
常用非線性模型
5.模型調參
貪心調參方法
網格調參方法
貝葉斯調參方法
小結線性回歸模型的資料集要盡量調整成正態分佈;
用時間靠前的4/5樣本當作訓練集,時間靠後的1/5當作驗證集,結果和五折交叉驗證差距不大;
線性回歸,ridge和lasso模型對比,前兩個較好,但ridge的coef引數很多較大,抗擾動弱;
常用模型中,隨機森林模型表現最好,lgbm二好;
DataWhale天池比賽 Task5
常見的整合學習方法有stacking bagging和boosting,同時這些整合學習方法與具體驗證集劃分聯絡緊密。由於深度學習模型一般需要較長的訓練週期,如果硬體裝置不允許建議選取留出法,如果需要追求精度可以使用交叉驗證的方法。那麼在10個cnn模型可以使用如下方式進行整合 dropout經常出...
天池新聞推薦比賽3 多路召回
具體 過多,詳情見 採用不同的召回策略,分別召回商品集,然後再進行排序。下圖是多路召回的示意圖 本次比賽採取的多路召回為5路召回,分別是 基於使用者的召回 由兩層深度網路組成,先粗排,然後再精排。基本架構如下 具體的原理見王喆的部落格 重讀youtube深度學習推薦系統 字字珠璣,驚為神文 4 yo...
Sixth day阿里雲天池打卡之集合與序列
一.今日學習內容概括 整體學習了集合與序列 二.具體學習內容 a 集合的建立 訪問值 內建方法 轉換 凍結 內建方法 許多函式的應用,包括add update remove discard pop intersection union difference symmetric issubset is...