召回率和準確率是資料探勘中**、網際網路中的搜尋引擎等經常涉及的兩個概念和指標。
召回率
:recall,又稱「查全率」——還是查全率好記,也更能體現其實質意義。
準確率
:precision,又稱「精度」、「正確率」。
以檢索為例,可以把搜尋情況用下圖表示:
相關
不相關
檢索到
a
b
未檢索到
c
d
a:檢索到的,相關的
(搜到的也想要的)
b:檢索到的,但是不相關的
(搜到的但沒用的)
c:未檢索到的,但卻是相關的
(沒搜到,然而實際上想要的)
d:未檢索到的,也不相關的
(沒搜到也沒用的)
如果我們希望:被檢索到的內容越多越好,這是追求「查全率」,即a/(a+c),越大越好。
如果我們希望:檢索到的文件中,真正想要的、也就是相關的越多越好,不相關的越少越好,這是追求「準確率」,即a/(a+b),越大越好。
「召回率」與「準確率」雖然沒有必然的關係(從上面公式中可以看到),在實際應用中,是相互制約的。要根據實際需求,找到乙個平衡點。
往往難以迅速反應的是「召回率」。我想這與字面意思也有關係,從「召回」的字面意思不能直接看到其意義。「召回」在中文的意思是:把xx調回來。「召回率」對應的英文「recall」,recall除了有上面說到的「order sth to return」的意思之外,還有「remember」的意思。
當我們問檢索系統某一件事的所有細節時(輸入檢索query查詢詞),recall指:檢索系統能「回憶」起那些事的多少細節,通俗來講就是「回憶的能力」。「能回憶起來的細節數」 除以 「系統知道這件事的所有細節」,就是「記憶率」,也就是recall——召回率。簡單的,也可以理解為查全率。
召回率與準確率
召回率和準確率是資料探勘中 網際網路中的搜尋引擎等經常涉及的兩個概念和指標。召回率 recall,又稱 查全率 還是查全率好記,也更能體現其實質意義。準確率 precision,又稱 精度 正確率 以檢索為例,可以把搜尋情況用下圖表示 相關 不相關 檢索到 a b 未檢索到 c d a 檢索到的,相...
召回率與準確率
召回率與準確率 fleetyang 召回率和準確率是資料探勘中 網際網路中的搜尋引擎等經常涉及的兩個概念和指標。召回率 recall,又稱 查全率 還是查全率好記,也更能體現其實質意義。準確率 precision,又稱 精度 正確率 以檢索為例,可以把搜尋情況用下圖表示 相關不相關 檢索到 a b ...
準確率與召回率
1 兩個最常見的衡量指標是 準確率 precision 你給出的結果有多少是正確的 和 召回率 recall 正確的結果有多少被你給出了 這兩個通常是此消彼長的 trade off 很難兼得。很多時候用引數來控制,通過修改引數則能得出乙個準確率和召回率的曲線 roc 這條曲線與x和y軸圍成的面積就是...