準確率(accuracy):這個公式計算比較簡單,就是**正確的樣本數量除以總的樣本數量
但是很多時候,這個往往不能滿足要求,比如樣本不平衡,比如我們更加關心另一類的**情況,這就會有問題, 比如你的樣本不均衡,以兩類問題為例:如果+1為10000,-1為50,那麼只要過擬合,即使-1全部分錯,正確率也是非常高的。如果我們更加關心-1的分類情況,這也沒法實現。所以引入了另外的指標
準確率(accuracy):(#(true positive) + # (true negative) ) / (#(true positive) + # (true negative) + #(false positive) + # (false negative))
召回率(recall):#(true positive) / (#(true positive) + #(false positive) )
精確率(precision):#(true positive) / (#(true positive) + #(false negative) )
f1: (a*a+1)*recall*precision/(a*a*(recall+precision))
a用於衡量召回率和精確率兩者之間的重要,如果等於1,表示一樣重要。
#(true positive) :代表第一類正確分類的樣本數量。#(true negative):代表第二類分類正確的樣本。#(false positive) :第二類誤認為第一類的樣本。 # (false negative):表示第一類誤認為第二類的樣本數量。
機器學習模型 知乎 機器學習 模型選擇與評價
交叉驗證 首先選擇模型最簡單的方法就是,利用每一種機器學習演算法 邏輯回歸 svm 線性回歸等 計算訓練集的損失值,然後選擇其中損失值最小的模型,但是這樣是不合理的,因為當訓練集不夠 特徵過多時容易過擬合,那麼訓練集的損失值就會不斷變小,但是此時針對測試集可能損失值很高,所以訓練集上的損失值是無法衡...
機器學習模型評價指標 混淆矩陣
在機器學習領域中,混淆矩陣 confusion matrix 是一種評價分類模型好壞的形象化展示工具。其中,矩陣的每一列表示的是模型 的樣本情況 矩陣的每一行表示的樣本的真實情況。1.混淆矩陣的舉例 例如用乙個分類模型來判別乙個水果是蘋果還是梨,混淆矩陣將會模型的 結果總結成如下表所示的 模型 結果...
機器學習 模型評價和優化方法
機器學習中的高偏差指的是模型的損失函式校驗中,訓練集和測試集error大,模型欠擬合 高方差是指訓練集的error小,測試集的error大,模型過擬合。通俗來說,高偏差問題就是採用訓練集訓練效果都不太好的模型,而高偏差問題就是訓練效果好,但是測試效果不好的模型,繪製學習曲線有助於了解演算法是高偏差問...