importnumpy as np
import
matplotlib.pyplot as plt
from sklearn import datasets
boston =datasets.load_boston()x = boston.data[:, 5] # 只使用房間數量這個特徵
50.0去除干擾資料資料分割為訓練集和測試集
from sklearn.model_selection import
train_test_split
x_train, x_test, y_train, y_test = train_test_split(x, y, random_state=666)
x_train.shape, y_train.shape
((367,), (367,))
#使用訓練集求歸回方程
在回歸方程下求測試集的**值
y_predict = a * x_test + b
#mse **值與真實值誤差衡量
mse_test = np.sum((y_predict - y_test)**2) /len(y_test)
mse_test
28.215949368640807
#rmse
from math import
sqrt
rmse_test =sqrt(mse_test)
rmse_test
5.311868726600913
#maemae_test = np.sum(np.absolute(y_predict - y_test)) /len(y_test)
mae_test
3.9489046062737834
from sklearn.metrics importmean_squared_error
from sklearn.metrics import mean_absolute_error
mean_squared_error(y_test, y_predict)
28.215949368640807
mean_absolute_error(y_test, y_predict)
3.9489046062737834
rsquare = 1 - mean_squared_error(y_test, y_predict) /np.var(y_test)rsquare
0.5682464825049472
from sklearn.metrics importr2_score
r2_score(y_test, y_predict)
0.5682464825049472
回歸分析定義衡量標準
如果不能對模型的訓練和測試的表現進行量化地評估,我們就很難衡量模型的好壞。通常我們會定義一些衡量標準,這些標準可以通過對某些誤差或者擬合程度的計算來得到。通過運算 決定係數r2 來量化模型的表現。模型的決定係數是回歸分析中十分常用的統計資訊,經常被當作衡量模型 能力好壞的標準。r2的數值範圍從0至1...
演算法的衡量
什麼是演算法?用來處理運算和邏輯的問題的 塊 執行時間的長短和占用記憶體空間的大小是衡量演算法好壞的重要標準 執行時間長短用時間複雜度來衡量 執行占用記憶體空間的大小用空間複雜度衡量 時間複雜度與空間複雜度 1.時間複雜度 即漸進時間複雜度,用o表示 時間複雜度就是程式的相對執行時間函式t n 簡化...
演算法效率的衡量
假設對於同一問題,我們給出了兩種解決演算法,在兩種演算法的實現中,我們對程式執行的時間進行了測算,發現兩段程式執行的時間相差懸殊,由此我們可以得出結論 實現演算法程式的執行時間可以反應出演算法的效率,即演算法的優劣。單靠時間值絕對可信嗎?假設我們將第二次嘗試的演算法程式執行在一台配置古老效能低下的計...