分類器的效能度量

一. 評估方法

1.留出法

「留出法」直接將資料集d劃分為兩個互斥的集合，其中乙個集合作為訓練集s，另乙個作為測試集t，在s上訓練處模型後，用t來評估其測試誤差，作為對泛化誤差的估計。

2.交叉驗證法

「交叉驗證法」先將資料集d劃分為k個大小相似的互斥子集，每個子集都盡可能保持資料分布的一致性，即從d中通過分層取樣得到，然後每次用k-1個子集的並集作為訓練集，餘下的那個子集作為測試集；這樣就可獲得k組訓練/測試集，從而可進行k次訓練和測試，最終返回的是這k個測試結果的均值。

二. 效能度量

真實情況

**結果正例

**結果反例

正例tp（真正例）

fn（反正例）

反例fp（假正例）

tn（真反例）

1.所謂的查準率p和查全率r分別定義為：p=

tptp

+fp,

r=tp

tp+f

n 2. f1：1f

1=12

(1p+

1r)

3.roc和auc

橫軸為假正例率，縱軸為真正例率，曲線為roc，auc為曲線下方面積，面積越大說明分類器的效能越優。

為什麼使用roc和auc評價分類器

既然已經這麼多標準，為什麼還要使用roc和auc呢？因為roc曲線有個很好的特性：當測試集中的正負樣本的分布變換的時候，roc曲線能夠保持不變。在實際的資料集中經常會出現樣本類不平衡，即正負樣本比例差距較大，而且測試資料中的正負樣本也可能隨著時間變化。