R語言 混淆矩陣 分類器診斷

2021-08-15 18:11:08 字數 1701 閱讀 6282

#混淆矩陣(confusion matrix)是一種特別定的**布局,可以視覺化分類器的效能

**分類

陽性陰性

陽性真陽性(

tp)

偽陽性(

fn)實際分類

陰性偽陰性(

fp)

真陰性(

tn)#利用100個例項訓練集

**分類

簽約不簽約

總計 簽約

3( tp)

8(fn)

11實際分類

不簽約2(

fp)

87(tn)

89總計5

98100

#精確度:模型能夠正確的對記錄進行分類的比例

accuracy = (

tp +

tn ) / (

tp +

tn +

fp +

fn) *

100%

#真陽性率(true positive rate)&召回率(recall):被分類器正確識別為陽性例項的比例

tpr =

tp / (

tp +

fn)recall

#偽陽性率(false positive rate):被分類器誤標記為陽性的百分比

fpr =

fp / (

fp +

tn)#偽陰性率(false negative rate):被分類器誤標記為陰性的百分比

fnr =

fn / (

tp +

fn)乙個效能好的模型應該有乙個較高tpr(

理想值是1),

乙個較低的fpr和fnr(

理想值是0)

#準確率(precision):被標記為陽性並且事實上也是陽性的例項的百分比

precision =

tp / (

tp +

fp)#下面運用混淆矩陣來診斷分類器

精確度 =

accuracy

= (

tp +

tn ) / (

tp +

tn +

fp +

fn) *

100%

= (3 +

87) / (

3 +

8 +

2 +87) *

100% =

90%tpr(

orrecall) =

tp / (

tp +

fn) =

3 / (

3 +

8) =

0.273

fpr =

fp / (

fp +

tn) =

2 / (

2 +

87) =

0.022

fnr =

fn / (

tp +

fn) =

8 / (

3 +

8) =

0.727

準確率 =

precision

= tp / (

tp +

fp) =

3 / (

3 +

2) =

0.6#精確度,fpr,準確率相對較好 tpr,fnr表現不佳

分類器評估 混淆矩陣和ROC曲線

為正樣本 1 為負樣本 1 原正樣本 1 真陽 tp 假陰 fn 原負樣本 1 假陽 fp 真陰 tn 這裡以二分類問題來討論 很明顯,理想完美的分類器的對角線為0,即所有正樣本 為正樣本,所有負樣本 為負樣本。由混淆矩陣可以得出的一些引數 1 accuracy 模型的精度,模型 正確個數 樣本的總...

Matlab畫混淆矩陣(多分類)

在神經網路和機器學習的結果分析中,常常會用混淆矩陣和roc曲線來分析識別 分類結果的好壞,而且 中也經常出現這種圖。對於卷積神經網路來說畫混淆矩陣很簡單,要用到函式plotconfusion,格式為plotconfusion 實際標籤,標籤 畫出來是這樣的 實際標籤是我們提前就知道的,標籤在神經網路...

多分類任務的混淆矩陣

今天我將討論如何在多分類中使用混淆矩陣評估模型的效能。什麼是混淆矩陣?它顯示了實際值和 值之間的差異。它告訴我們有多少資料點被正確 哪些資料點沒有被正確 對於多分類來說,它是乙個 n n 矩陣,其中 n 是編號。輸出列中的類別,也稱為目標屬性。一二分類任務中包含了 2 個類也就是乙個 22 矩陣,一...