from sklearn importdatasets
from sklearn.linear_model import
linearregression
import
matplotlib.pyplot as plt
#載入資料
loaded_data =datasets.load_boston()
data_x =loaded_data.data
data_y =loaded_data.target
#是否需要對資料進行拆分
#定義模型
model =linearregression()#訓練
model.fit(data_x,data_y)
#y = 0.1x+0.3
print(model.coef_) #
輸出斜率0.1
print(model.intercept_) #
輸出截距0.3
data_x的**值,與data_y(真實值)之間的打分
print(model.score(data_x,data_y)) #
對 model 用 r^2 的方式進行打分r^2 coefficient of determination
posted on 2017-12-06 21:06收藏
sklearn 引數搜尋
引數搜尋 提前設定好引數可以選擇的候選值,然後根據不同引數組合對於模型泛化能力的貢獻,選取最佳的超引數組合。gridsearchcv,基於交叉驗證的網格搜尋法 將要搜尋的引數候選值輸入搜尋器內,搜尋器遍歷每一種引數組合,使用交叉驗證法對比每種引數組合下模型的表現,返回表現最好模型的引數值 優點 自動...
sklearn超引數搜尋
1,超引數 在模型訓練中,有些引數不能通過對資料進行學習得到,這種引數叫做超引數。比如,神經網路的層數,每層的神經元數量等。from sklearn.model selection import gridsearchcv from sklearn import svm,datasets defgs ...
Sklearn引數詳解 GBDT
這篇介紹boosting的第二個模型gbdt,gbdt和adaboost都是boosting模型的一種,但是略有不同,主要有以下兩點不同 class sklearn.ensemble.gradientboostingclassifier loss deviance learning rate 0.1...