《百面機器學習》模型評估

沒有測量，就沒有科學。

-----門捷列夫

在模型評估過程中，分類問題、排序問題、回歸問題往往需要使用不同的指標進行評估。在諸多的評估指標中，大部分指標只能片面地反映模型的一部分效能。如果不能合理地運用評估指標，不僅不能發現模型本身的問題，而且會得出錯誤的結論。

準確率（ accuracy），精確率（ precision），召回率（ recall），均方根誤差（ root mean square error， rmse）

準確率是分類問題中最簡單也是最直觀的評價指標，但存在明顯的缺陷。比如，當負樣本佔99%時，分類器把所有樣本都**為負樣本也可以獲得99%的準確率。所以，當不同類別的樣本比例非常不均衡時，佔比大的類別往往成為影響準確率的最主要因素。

- 真陽性（true positive，tp）：指被分類器正確分類的正例資料

- 真陰性（true negative，tn）：指被分類器正確分類的負例資料

- 假陽性（false positive，fp）：將負類**為正類數 (誤檢)

- 假陰性（false negative，fn）：將正類**為負類數（漏檢）

準確率accuracy =（tp+tn）/(tp+tn+fp+fn)

正檢率 = tp/(tp+tn+fp+fn)

誤檢率 = fp/(tp+tn+fp+fn)

漏檢率 = fn/(tp+tn+fp+fn)

precision = tp/（tp+fp）；

recall = tp/(tp+fn)=tp/p ；

正樣本對總數p = tp+ fn

負樣本對總數 n = tn+ fp

roc曲線的橫座標為：fpr = fp/n，縱座標為：tpr=tp/p

1. 誤識率(false accept rate, far)：這是將其他人誤作指定人員的概率;

2. 拒識率(false reject rate , frr)：這是將指定人員誤作其它人員的概率；

計算方法：設定乙個分數閾值t，far=非同人分數》t/非同人比較的次數，frr=同人比較分數一般，far=0.001時，frr的值作為參考，值越小，效能越好。

誤識率far=錯誤識別為正樣本數/負樣本對總數= fp /n；far=fpr

拒識率frr=錯誤識別為負樣本數/正樣本對總數= fn/p；frr=1-tpr

3. 採用的閾值不同，far和frr這兩個指標也不相同，一般情況下，誤識率（far）隨著閾值放寬條件而增大，拒識率（frr）隨著閾值放寬條件而減小。因此，可以採用等錯率(equal error rate, eer)作為效能的指標，eer是拒識率和誤識率的乙個平衡點(far=frr)，等錯率能夠取到的值越低，表示演算法的效能越好；

4. auc值作為演算法好壞的評判標準，面積越大，表示分類效能越好

mapprecision = tp/（tp+fp）；

recall = tp/(tp+fn)=tp/p ；

把每種recall對應最大的precision求和取平均即ap。

筆記於《百面機器學習》

《百面機器學習》模型評估

機器學習面筆試模型評估篇

百面機器學習

機器學習的模型評估

《百面機器學習》模型評估

機器學習面筆試 模型評估篇

百面機器學習

機器學習的模型評估

相關推薦

機器學習面筆試模型評估篇