準確率是乙個用於評估分類模型的指標。通俗來說,準確率是指我們的模型**正確的結果所佔的比例。正式點說,準確率的定義如下:
accuracy=number of correct predictionstotal number of predictions
對於二元分類,也可以根據正類別和負類別按如下方式計算準確率:
accuracy=tp+tntp+tn+fp+fn
其中,tp = 真正例,tn = 真負例,fp = 假正例,fn = 假負例。
讓我們來試著計算一下以下模型的準確率,該模型將 100 個腫瘤分為惡性 (正類別)或良性(負類別):
真正例 (tp):假正例 (fp):
假負例 (fn):真負例 (tn):
accuracy=tp+tntp+tn+fp+fn=1+901+90+1+8=0.91
準確率為 0.91,即 91%(總共 100 個樣本中有 91 個**正確)。這表示我們的腫瘤分類器在識別惡性腫瘤方面表現得非常出色,對吧?
實際上,只要我們仔細分析一下正類別和負類別,就可以更好地了解我們模型的效果。
在 100 個腫瘤樣本中,91 個為良性(90 個 tn 和 1 個 fp),9 個為惡性(1 個 tp 和 8 個 fn)。
在 91 個良性腫瘤中,該模型將 90 個正確識別為良性。這很好。不過,在 9 個惡性腫瘤中,該模型僅將 1 個正確識別為惡性。這是多麼可怕的結果!9 個惡性腫瘤中有 8 個未被診斷出來!
雖然 91% 的準確率可能乍一看還不錯,但如果另乙個腫瘤分類器模型總是**良性,那麼這個模型使用我們的樣本進行**也會實現相同的準確率(100 個中有 91 個**正確)。換言之,我們的模型與那些沒有**能力來區分惡性腫瘤和良性腫瘤的模型差不多。
當您使用分類不平衡的資料集(比如正類別標籤和負類別標籤的數量之間存在明顯差異)時,單單準確率一項並不能反映全面情況。
準確率召回率
知道意思,但是有時候要很清晰地向同學介紹則有點轉不過彎來。召回率和準確率是資料探勘中 網際網路中的搜尋引擎等經常涉及的兩個概念和指標。召回率 recall,又稱 查全率 還是查全率好記,也更能體現其實質意義。準確率 precision,又稱 精度 正確率 以檢索為例,可以把搜尋情況用下圖表示 相關 ...
召回率與準確率
召回率和準確率是資料探勘中 網際網路中的搜尋引擎等經常涉及的兩個概念和指標。召回率 recall,又稱 查全率 還是查全率好記,也更能體現其實質意義。準確率 precision,又稱 精度 正確率 以檢索為例,可以把搜尋情況用下圖表示 相關 不相關 檢索到 a b 未檢索到 c d a 檢索到的,相...
召回率與準確率
召回率和準確率是資料探勘中 網際網路中的搜尋引擎等經常涉及的兩個概念和指標。召回率 recall,又稱 查全率 還是查全率好記,也更能體現其實質意義。準確率 precision,又稱 精度 正確率 以檢索為例,可以把搜尋情況用下圖表示 相關 不相關 檢索到 a b 未檢索到 c d a 檢索到的,相...