在中,混淆矩陣(confusion matrix)是視覺化工具,一般也叫做匹配矩陣。
混淆矩陣的每一列代表了**類別,每一行代表了資料的真實歸屬類別,每一列的總數表示**為該類別的資料的數目(即通過演算法被分為該類的數目),每一行的資料總數表示該類別的資料例項的數目
如下表,第一行第一列中的43表示有43個實際歸屬第一類的例項被**為第一類,第一行第二列中的5表示有5個實際歸屬第二類的例項被**為第一類。同理,第二行第一列的2表示有2個實際歸屬為第二類的例項被錯誤**為第一類。
如有150個樣本資料,這些資料分成3類,每類50個。分類結束後得到的混淆矩陣為:
類1類2
類3類1
類2類3
每一行之和為50,表示50個樣本,
第一行說明類1的50個樣本有43個分類正確,5個錯分為類2,2個錯分為類3。
源自:(1)通過網路資源查詢,基本論述是:
對於多分類問題,把每個類別單獨視為」正「,把其它剩餘的類別都視為」負「,按照二分類情況時的求解方法,求出此時的精確率與召回率,然後再取平均即可。
所主要檢視的資源:
(2)根據混淆矩陣,計算精確率與召回率的示例**:
(3)關於精確率、召回率和f值概念的介紹:
(4)利用fit_generator來獲得混淆矩陣:
示例2:
fit_generator的用法:
(5)利用python繪製混淆矩陣圖:
(6)混淆矩陣、auc和roc
混淆矩陣(confusion matrix)
乙個完美的分類模型是,將實際上是good的例項 成good,將bad的例項 稱bad。對於實際應用中的分類模型,可能 錯誤例項型別,因此我們需要知道到底 對了多少例項,錯了多少例項。混淆矩陣就是將這些資訊放在乙個表中,便於直觀的觀測和分析。在分類問題中,的情形存在如下四種 1.good good t...
混淆矩陣 Confusion Matrix
混淆矩陣是除了roc曲線和auc之外的另乙個判斷分類好壞程度的方法。以下有幾個概念需要先說明 tp true positive 真實為0,也為0 fn false negative 真實為0,為1 fp false positive 真實為1,為0 tn true negative 真實為1,也為1...
混淆矩陣 confusion matrix
我們以乙個二分類問題舉例說明 x x1,x2 x100 y 真實 1,0,0,0,1,1,1 假設60個1,40個0 y 0,1,0,1 70個1,30個0 假設我們 中的70個正例中只有50個是真正例 即 的真結果和實際情況一樣 假正例 70 50 20 故名思意,即 的正例和實際情況不一樣 查準...