# k近鄰,適用於小型資料集,是很好的基準模型,容易解釋from sklearn.neighbors import kneighborsclassifier
# 線性模型,非常可靠的首選演算法,適用於很大的資料集,也適用於高維資料
from sklearn.linear_model import linearregression
# 樸素貝葉斯,只適用於分類問題,比線性模型速度還快,適用於非常大的資料集和高維資料,但精度通常低於線性模型
from sklearn.linear_model import bayesianridge
# 決策樹,速度很快,不需要資料縮放,可以視覺化,很容易解釋
from sklearn.tree import decisiontreeclassifier
# 隨機森林,幾乎總是比單個決策樹的表現要好,魯棒性很好,非常強大。不需要資料縮放,不適用於高維稀疏矩陣
from sklearn.ensemble import randomforestclassifier
# 梯度提公升決策樹,精度通常比隨機森林略高,與隨機森林相比,訓練速度更慢,但是**速度更快,需要的記憶體也少,比隨機森林需要更多的引數調節
from sklearn.ensemble import gradientboostingclassifier
# 支援向量機,對於特徵含義相似的中等大小的資料集很強大,需要資料縮放,對引數敏感
from sklearn.svm import svc
# 神經網路,可以構建非常複雜的模型,特別是對於大型資料而言。對資料縮放敏感,對引數選取敏感,大型網路需要很長的訓練時間
from sklearn.neural_network import mlpclassifier
監督學習和無監督學習 監督學習與非監督學習
監督學習 supervised learning 的任務是學習乙個模型,使模型能夠對任意給定的輸入,對其相應的輸出做出乙個好的 即 利用訓練資料集學習乙個模型,再用模型對測試樣本集進行 例如kaggle上的鐵達尼號比賽。官方提供旅客資料 資料集1 姓名,年齡,性別,社會經濟階層,是否生存等 要求參賽...
監督學習,無監督學習和半監督學習
監督學習 supervised learning 無監督學習 unsupervised learning 半監督學習 semi supervised learning 2 概念 監督學習 用一部分已知分類 有標記的樣本來訓練機器後,讓它用學到的特徵,對沒有還分類 無標記的樣本進行分類 貼標籤。一句話...
監督學習 非監督學習 半監督學習(主動學習)
統計學習通常包括監督學習 非監督學習 半監督學習以及強化學習,在機器學習的領域中前三種研究的比較多的,也是運用的比較廣泛的技術。監督學習的任務是學習乙個模型,使模型對給定的任意的乙個輸入,對其都可以對映出乙個 結果。這裡模型就相當於我們數學中乙個函式,輸入就相當於我們數學中的x,而 的結果就相當於數...