先看下面這張圖來理解了,後面再具體分析。下面用p代表precision,r代表recall
通俗的講,precision 就是檢索出來的條目中(比如網頁)有多少是準確的,recall就是所有準確的條目有多少被檢索出來了。
下面這張圖介紹true positive,false negative等常見的概念,p和r也往往和它們聯絡起來。
我們當然希望檢索的結果p越高越好,r也越高越好,但事實上這兩者在某些情況下是矛盾的。比如極端情況下,我們只搜出了乙個結果,且是準確的,那麼p就是100%,但是r就很低;而如果我們把所有結果都返回,那麼必然r是100%,但是p很低。
因此在不同的場合中需要自己判斷希望p比較高還是r比較高。如果是做實驗研究,可以繪製precision-recall曲線來幫助分析(我應該會在以後介紹)。
前面已經講了,p和r指標有的時候是矛盾的,那麼有沒有辦法綜合考慮他們呢?我想方法肯定是有很多的,最常見的方法應該就是f measure了,有些地方也叫做f score,都是一樣的。
f measure 是precision和recall加權調和平均:
f1-measure
當引數β=1時,就是最常見的f1-measure了:
f1 = 2p*r / (p+r)
查準與召回(Precision Recall)
先看下面這張圖來理解了,後面再具體分析。下面用p代表precision,r代表recall 通俗的講,precision 就是檢索出來的條目中 比如網頁 有多少是準確的,recall就是所有準確的條目有多少被檢索出來了。下面這張圖介紹true positive,false negative等常見的概...
資料探勘中正確率 召回率和F值 查全率和查準率
正確率 召回率和f值 是在魚龍混雜的環境中,選出目標的重要評價指標。不妨看看這些指標的定義先 正確率 正確識別的個體總數 識別出的個體總數 召回率 正確識別的個體總數 測試集中存在的個體總數 f值 正確率 召回率 2 正確率 召回率 不妨舉這樣乙個例子 某池塘有1400條鯉魚,300只蝦,300只鱉...
精確率與召回率
混淆矩陣 true positive 真正,tp 將正類 為正類數.true negative 真負 tn 將負類 為負類數.false positive 假正,fp 將負類 為正類數 誤報 type i error false negative 假負 fn 將正類 為負類數 漏報 type ii ...