混淆矩陣是除了roc曲線和auc之外的另乙個判斷分類好壞程度的方法。
以下有幾個概念需要先說明:
tp(true positive): 真實為0,**也為0
fn(false negative): 真實為0,**為1
fp(false positive): 真實為1,**為0
tn(true negative): 真實為1,**也為1
舉個經典的二分類例子:
如果是多分類的呢?舉乙個三分類的例子:
因此我們知道,計算specificity,recall,precision等只是計算某一分類的特性,而accuracy和f1-score這些是判斷分類模型總體的標準。我們可以根據實際需要,得出不同的效果。
混淆矩陣(confusion matrix)
乙個完美的分類模型是,將實際上是good的例項 成good,將bad的例項 稱bad。對於實際應用中的分類模型,可能 錯誤例項型別,因此我們需要知道到底 對了多少例項,錯了多少例項。混淆矩陣就是將這些資訊放在乙個表中,便於直觀的觀測和分析。在分類問題中,的情形存在如下四種 1.good good t...
初學混淆矩陣
在中,混淆矩陣 confusion matrix 是視覺化工具,一般也叫做匹配矩陣。混淆矩陣的每一列代表了 類別,每一行代表了資料的真實歸屬類別,每一列的總數表示 為該類別的資料的數目 即通過演算法被分為該類的數目 每一行的資料總數表示該類別的資料例項的數目 如下表,第一行第一列中的43表示有43個...
混淆矩陣 confusion matrix
我們以乙個二分類問題舉例說明 x x1,x2 x100 y 真實 1,0,0,0,1,1,1 假設60個1,40個0 y 0,1,0,1 70個1,30個0 假設我們 中的70個正例中只有50個是真正例 即 的真結果和實際情況一樣 假正例 70 50 20 故名思意,即 的正例和實際情況不一樣 查準...