二分類評測指標

2021-10-01 04:47:23 字數 883 閱讀 3048

一定要搞清楚

markdown不支援複雜**製作,所以word做好以後截圖。

這張表極其關鍵。

簡單梳理一下,**的結果是後面的字母,真實的結果是前面的字母。

好了,接下來梳理指標:

查準率和查全率是一對矛盾的度量,一般來說precision高,recall往往偏低;而recall高,precision往往偏低。所以就有了p-r曲線。顯然,藍色曲線越接近右上角,分類器效能越好。一些文章中的p-r curve是光滑的,注意,這一般是為了美觀和構圖方便起見

首先auc值是乙個概率值,當你隨機挑選乙個正樣本以及乙個負樣本,當前的分類演算法根據計算得到的score值將這個正樣本排在負樣本前面的概率就是auc值。 auc值越大,當前的分類演算法越有可能將正樣本排在負樣本前面,即能夠更好的分類。

二分類問題模型指標

正如下圖所示,f1的值同時受到p r的影響,單純地追求p r的提公升並沒有太大作用。在實際業務工程中,結合正負樣本比,的確是一件非常有挑戰的事。auc是roc的積分 曲線下面積 是乙個數值,一般認為越大越好,數值相對於曲線而言更容易當做調參的參照。pr曲線會面臨乙個問題,當需要獲得更高recall時...

二分類問題評價指標

當乙個分類器建立後,要對其分類準確度進行評價。分類器的效能評價不僅能夠指導分類器的訓練過程,而且可以比較不同分類器的效能。本文主要介紹混淆矩陣和常用的幾個評價指標。對於乙個二分類問題,可以得到如下的混淆矩陣,行表示資料在模型上的 類別 predicted class predicted condit...

二分類模型評估指標

accuracy tp tn tp fp tn fn 即正確 的正反例數 總數。準確率是 正確的結果佔總樣本的百分比,是很自然就會想到的指標,但很多專案場景都不適用!最主要的原因是樣本不平衡。舉個簡單的例子,比如在乙個總樣本中,正樣本佔90 負樣本佔10 樣本是嚴重不平衡的。對於這種情況,我們只需要...