準確率 召回率和綜合評價指標

2021-09-25 08:43:46 字數 1374 閱讀 2675

最近在準備比賽,由於比賽涉及到準確率,召回率和綜合評價指標,雖然以前都看過,但是突然間忘了,顯得很是尷尬,所以寫篇部落格來幫自己做一下筆記。

準確率和召回率這兩個通常是此消彼長的(trade off),很難兼得。很多時候用引數來控制,通過修改引數則能得出乙個準確率和召回率的曲線(roc),這條曲線與x和y軸圍成的面積就是auc(roc  area)。auc可以綜合衡量乙個**模型的好壞,這乙個指標綜合了precision和recall兩個指標。

但auc計算很麻煩,有人用簡單的f-score來代替。f-score計算方法很簡單:

f-score=(2*precision*recall)/(precision+recall)

即使不是算數平均,也不是幾何平均。可以理解為幾何平均的平方除以算術平均。

現在我讓你去乙個箱子裡面摸球,在箱子裡面有14個紅球,3個黃球,3個藍球。經過你的一番努力,你一共摸到了7個紅球,2個黃球和1個藍球,那麼此時你的準確率和召回率便是:

準確率=7/(7+2+1)=70%,

召回率=7/14=50%,

f值=2*0.7*0.5/(0.7+0.5)=58.3%

為了能給大家更為形象的展示,這裡我選擇展示極限的情況,極為:你把所有的球都摸出來了,那麼結果便是:

準確率=14/(14+3+3)=70%,

召回率=14/14=100%,

f值=2*0.7*1/(0.7+1)=82.35%

由此可見,正確率是評估捕獲的成果中目標成果所佔得比例;召回率,顧名思義,就是從關注領域中,召回目標類別的比例;而f值,則是綜合這二者指標的評估指標,用於綜合反映整體的指標。

當然希望檢索結果precision越高越好,同時recall也越高越好,但事實上這兩者在某些情況下有矛盾的。比如極端情況下,我們只搜尋出了乙個結果,且是準確的,那麼precision就是100%,但是recall就很低;而如果我們把所有結果都返回,那麼比如recall是100%,但是precision就會很低。因此在不同的場合中需要自己判斷希望precision比較高或是recall比較高。如果是做實驗研究,可以繪製precision-recall曲線來幫助分析。

p和r指標有時候會出現的矛盾的情況,這樣就需要綜合考慮他們,最常見的方法就是f-measure(又稱為f-score)。

f-measure是precision和recall加權調和平均:

當引數α=1時,就是最常見的f1,也即

可知f1綜合了p和r的結果,當f1較高時則能說明試驗方法比較有效。

e值表示查準率p和查全率r的加權平均值,當其中乙個為0時,e值為1,其計算公式:

b越大,表示查準率的權重越大。

召回率 和 準確率

首先,要先理解,tp,真正,將正類 成正類數 對了 fn,假負,將正類 成負類數 錯了 fp,假正,將負類 成正類數 錯了 tn,真負,將負類 成負類數 對了 第一字母是判斷的對錯,第二字母是判斷的對錯的類別 類別 yesno 實際類別 yestp fnno fptn 準確率 針對本人,意思你給出的...

準確率和召回率

鏈結 定義 正確率 提取出的正確資訊條數 提取出的資訊條數 召回率 提取出的正確資訊條數 樣本中的資訊條數 兩者取值在0和1之間,數值越接近1,查準率或查全率就越高。f值 正確率 召回率 2 正確率 召回率 f 值即為正確率和召回率的調和平均值 不妨舉這樣乙個例子 某池塘有1400條鯉魚,300只蝦...

準確率召回率

知道意思,但是有時候要很清晰地向同學介紹則有點轉不過彎來。召回率和準確率是資料探勘中 網際網路中的搜尋引擎等經常涉及的兩個概念和指標。召回率 recall,又稱 查全率 還是查全率好記,也更能體現其實質意義。準確率 precision,又稱 精度 正確率 以檢索為例,可以把搜尋情況用下圖表示 相關 ...