#獲取乙個特徵
diabetes_x_temp = diabetes.data[:, np.newaxis, 2]
diabetes_x_train = diabetes_x_temp[:-20]#訓練樣本
diabetes_x_test = diabetes_x_temp[-20:]#測試樣本 後20行
diabetes_y_train = diabetes.target[:-20]#訓練標記
diabetes_y_test = diabetes.target[-20:]#**對比標記
#回歸訓練及**
clf = linear_model.linearregression()
clf.fit(diabetes_x_train,diabetes_y_train) #訓練資料集
#驗證集
print '驗證集',diabetes_x_test
print '**結果',clf.predict(diabetes_x_test)
#係數 殘差平方 方差得分
print '係數:',clf.coef_
print ('殘差平方:%.2f'%np.mean((clf.predict(diabetes_x_test)-diabetes_y_test)**2))
print ('方差得分: %.2f' % clf.score(diabetes_x_test,diabetes_y_test))
#繪圖plt.title('linearregression diabetes')
plt.xlabel('attributes')
plt.ylabel('measure of diabetes')
plt.scatter(diabetes_x_test,diabetes_y_test,color='black')#點的準確位置
plt.plot(diabetes_x_test,clf.predict(diabetes_x_test),color='blue',linewidth = 3)#**結果,直線表示
plt.show()
結果
驗證集 [[ 0.07786339]
[-0.03961813]
[ 0.01103904]
[-0.04069594]
[-0.03422907]
[ 0.00564998]
[ 0.08864151]
[-0.03315126]
[-0.05686312]
[-0.03099563]
[ 0.05522933]
[-0.06009656]
[ 0.00133873]
[-0.02345095]
[-0.07410811]
[ 0.01966154]
[-0.01590626]
[-0.01590626]
[ 0.03906215]
[-0.0730303 ]]
**結果 [ 225.9732401 115.74763374 163.27610621 114.73638965 120.80385422
158.21988574 236.08568105 121.81509832 99.56772822 123.83758651
204.73711411 96.53399594 154.17490936 130.91629517 83.3878227
171.36605897 137.99500384 137.99500384 189.56845268 84.3990668 ]
係數: [ 938.23786125]
殘差平方:2548.07
方差得分: 0.47
線性回歸練習
1 極大似然估計原理 它是建立在極大似然原理的基礎上的乙個統計方法,極大似然原理的直觀想法是,乙個隨機試驗如有若干個可能的結果a,b,c,若在一次試驗中,結果a出現了,那麼可以認為實驗條件對a的出現有利,也即出現的概率p a 較大。極大似然原理的直觀想法我們用下面例子說明。設甲箱中有99個白球,1個...
線性回歸練習
excel做回歸分析,主要分析資料意義 multiple r x和y的相關係數r,一般在 1 1之間,絕對值越靠近1則相關性越強,越靠近0則相關性越弱 r square x和y的相關係數r的平方,表達自變數x解釋因變數y變差的程度,以測定量y的擬合效果 adjusted r square 調整後的r...
資料探勘之回歸分析
資料探勘之回歸分析綜述 史趙鋒 長春理工大學 資訊與計算科學系 摘要 資料探勘中回歸分析方法是建立複雜物件外特性模型的一類重要方法.此文對現有各種回歸方法進行了綜述.採用乙個統一的目標函式來解釋各種回歸方法,並以此為基礎,系統介紹了各種回歸分析方法 包括常見的主成分分析法和部分最小二乘法 pls 的...