召回率和準確率是資料探勘中**、網際網路中的搜尋引擎等經常涉及的兩個概念和指標。
召回率
:recall,又稱「查全率」——還是查全率好記,也更能體現其實質意義。
準確率
:precision,又稱「精度」、「正確率」。
以檢索為例,可以把搜尋情況用下圖表示:
相關
不相關
檢索到
a
b
未檢索到
c
d
a:檢索到的,相關的
(搜到的也想要的)
b:檢索到的,但是不相關的
(搜到的但沒用的)
c:未檢索到的,但卻是相關的
(沒搜到,然而實際上想要的)
d:未檢索到的,也不相關的
(沒搜到也沒用的)
如果我們希望:被檢索到的內容越多越好,這是追求「查全率」,
即a/(a+c),越大越
好。如果我們希望:檢索到的文件中,真正想要的、也就是相關的越多越好,不相關的越少越好,這是追求「準
確率」,即a/(a+b),越大越好。
「召回率」與「準確率」雖然沒有必然的關係(從上面公式中可以看到),在實際應用中,是相互制約的。要根據實際需求,找到乙個平衡點。
往往難以迅速反應的是「召回率」。我想這與字面意思也有關係,從「召回」的字面意思不能直接看到其意義。「召回」在中文的意思是:把xx調回來。「召回率」對應的英文「recall」,recall除了有上面說到的「order sth to return」的意思之外,還有「remember」的意思。
當我們問檢索系統某一件事的所有細節時(輸入檢索query查詢詞),recall指:檢索系統能「回憶」起那些事的多少細節,通俗來講就是「回憶的能力」。「能回憶起來的細節數」 除以 「系統知道這件事的所有細節」,就是「記憶率」,也就是recall——召回率。簡單的,也可以理解為查全率
--------------------------------------
正確率,召回率和f值
正確率、召回率和f值是在魚龍混雜的環境中,選出目標的重要評價指標。
不妨看看這些指標的定義先:
正確率 = 正確識別的個體總數 / 識別出的個體總數
召回率 = 正確識別的個體總數 / 測試集中存在的個體總數
f值 = 正確率 * 召回率 * 2 / (正確率 + 召回率)
不妨舉這樣乙個例子:某池塘有1400條鯉魚,300只蝦,300只鱉。現在以捕鯉魚為目的。seaeagle撒一大網,逮著了700條鯉魚,200只蝦,100只鱉。那麼,這些指標分別如下:
正確率 = 700 / (700 + 200 + 100) = 70%
召回率 = 700 / 1400 = 50%
f值 = 70% * 50% * 2 / (70% + 50%) = 58.3%
不妨看看如果seaeagle把池子裡的所有的鯉魚、蝦和鱉都一網打盡,這些指標又有何變化:
正確率 = 1400 / (1400 + 300 + 300) = 70%
召回率 = 1400 / 1400 = 100%
f值 = 70% * 100% * 2 / (70% + 100%) = 82.35%
由此可見,正確率是評估捕獲的成果中目標成果所佔得比例;召回率,顧名思義,就是從關注領域中,召回目標類別的比例;而f值,則是綜合這二者指標的評估指標,用於綜合反映整體的指標。
召回率與正確率
在機器學習 推薦系統等現實的情形中,我們往往會在不同的時候關注結果的不同部分,而召回率與正確率恰恰是對結果在不同側面的度量。召回率 召回率的設計目的是度量輸出結果中包含ground truth的量的多少。舉個例子,一天我和章小賤去逛漫展,拍了好多 這裡假設400張吧 然後讓章小賤找出我們倆拍了 的c...
正確率 召回率和F值
其實這東西沒有必要非得記住怎麼定義的,需要用衡量指標的時候過來查一查就知道了,原文在這裡 正確率 召回率和f值是在魚龍混雜的環境中,選出目標的重要評價指標。不妨看看這些指標的定義先 正確率 正確識別的個體總數 識別出的個體總數 召回率 正確識別的個體總數 測試集中存在的個體總數 f值 正確率 召回率...
正確率 召回率和F值
正確率 召回率和f值是目標的重要評價指標。正確率 正確識別的個體總數 識別出的個體總數 召回率 正確識別的個體總數 測試集中存在的個體總數 f值 正確率 召回率 2 正確率 召回率 不妨舉這樣乙個例子 某池塘有1400條鯉魚,300只蝦,300只鱉。現在以捕鯉魚為目的。seaeagle撒一大網,逮著...