機器學習之分類學習(效能分析)

2021-08-07 12:42:18 字數 649 閱讀 9308

在上面我們得到了乙個邏輯回歸模型,但我們需要這個模型的效能如何,也是知道這個模型學習的成果如何,要進行期末考試。

考試,顧名思義是給模型發答卷,答卷就是前面我們提取出來的測試資料,我們把測試據中的結果抽空作為標準答案,讓模型答題,最後對照標準答案給分。

# 使用訓練好的模型lr對x_test進行**,結果儲存在變數lr_y_predict中。

lr_y_predict = lr.predict(x_test)

# 從sklearn.metrics裡匯入classification_report模組。

from sklearn.metrics import classification_report

# 使用邏輯斯蒂回歸模型自帶的評分函式score獲得模型在測試集上的準確性結果。

print ('accuracy of lr classifier:', lr.score(x_test, y_test))

# 利用classification_report模組獲得logisticregression其他三個指標的結果。

print (classification_report(y_test, lr_y_predict, target_names=['benign', 'malignant']))

機器學習之分類學習(模型訓練)

完成資料的預處理,接下進入分類學習中的重點 模型訓練。在前面我們得到了一批資料,現在我們需要從中提取出一部分資料作為我們訓練的資料,當然我們也可以把全部的資料作為我們訓練的資料,但是如果我們把全部的資料都拿來作為訓練就沒有資料來測試我們模型的效能了,因為訓練資料和測試資料不能重疊,不然就是作弊了,這...

theano學習之分類學習

from future import print function import numpy as np import theano import theano.tensor as t 該函式功能用來計算準確率 def compute accuracy y target,y predict corr...

機器學習效能度量

回歸評估指標 分類評估指標 聚類評估指標 參考常見的評估方法有 1.留出法 hold out 2.交叉驗證法 cross validation 3.自助法 bootstrap 將已有的資料集分為兩個互斥的部分 保證資料s與t的分布一致 測試集比例一般保持在1 3 1 5 將原始資料分成k組 一般是均...