由於我要打的比賽是做乙個二分類**器,所以就開始找到有關的模型進行了解學習。常見的分類模型如下:
邏輯回歸(logistic regression, lr)
樸素貝葉斯(***** bayes, nb)
k近鄰(k-nearest neighbors, knn)
決策樹(decision tree, dt)
支援向量機(support vector machine, svm)
神經網路(neural network, nn)
k近鄰演算法
機器學習(一)——k-近鄰(knn)演算法
邏輯回歸
機器學習–logistic回歸計算過程的推導
邏輯回歸容易出現過擬合的問題,導致維度災難,參考:分類問題中的維度災難
支援向量機:
支援向量機通俗導論(理解svm的三層境界)
決策樹這塊的知識就比較深了,通過網上查的資料得知樹模型**的精度通常比其他模型高,因此決定這次比賽採用樹模型。當然,最好的情況肯定是試驗各種模型,再挑選最好的模型。
機器學習方法(四):決策樹decision tree原理與實現技巧 隨機森林
gbdt(mart) 迭代決策樹入門教程 | 簡介
adaboost演算法原理分析和例項+**(簡明易懂)
xgboost入門與實戰(原理篇)
機器學習筆記(七)boost演算法(gdbt,adaboost,xgboost)原理及實踐
sk-learn是必須要學的乙個包:sk-learn教程
中文文件
cross-validation(交叉驗證)詳解
【機器學習】模型融合方法概述 棧模型是重點
模型融合
接下來就是要學習xgboost和sklearn的調參方法了。
資料探勘初探
資料探勘技術分類 1 關聯分析 啤酒和尿布,猜你喜歡 用於做關聯分析的演算法有apriori 2 分類分析 事先知道類別和分類標準,使用者信用分層 3 序列模式 訪問路徑 購買路徑 4 聚類分析 分類分析的逆過程,聚類分析之前還不知道類別,從大量資料集合中,自動劃分類別。劃分標準是類內差別最小,類間...
資料探勘 模型融合
在模型調參結束後,我我們就可以進行模型融合了 這是最後也是乙個相當重要的環節,方式大概有有以下幾種 模型融合是比賽後期乙個重要的環節,大體來說有如下的型別方式。簡單加權融合 stacking blending boosting bagging 在xgboost,adaboost,gbdt中已經用到 ...
資料探勘 模型融合
模型融合是比賽後期乙個重要的環節,大體來說有如下的型別方式。簡單加權融合 stacking blending boosting bagging 在xgboost,adaboost,gbdt中已經用到 1 平均融合 對於回歸問題,乙個簡單直接的思路是取平均。也可以採用加權平均,而權值可以用排序的方法確...