在資訊檢索系統中,召回率和準確率的定義為:
召回率:(recall ratio,簡稱r)是衡量資訊檢索系統在實施某一檢索作業時檢出相關文獻能力的一種測度指標,其計算方法為:recall=檢出的相關文獻量/檢索系統中的相關文獻總量.
準確率:(precision ratio,簡稱p)是衡量系統在實施某一檢索作業時檢索精準度的乙個測度指標,其計算方法為:
precision=檢出的相關文獻量/檢出的文獻總量.
召回率為:4/10 = 40%
準確率為:4/8 = 50%
召回率為:4/10 = 40%
準確率為:4/8 = 50%
也就是兩個系統針對的這兩次查詢,檢索效果一樣,其實直觀的感覺,第二個系統的檢索效果明顯好於第乙個檢索系統,打個比方,第乙個系統的檢索好像是從一把沙中挑出幾個貝克,而第二個檢索系統是從一籮筐沙中挑出那幾個貝克,顯然第二個系統的難度大多了。這就是傳統召回率和準確率的弊端,並不能反映這些差別。
所以,需要一種新的召回率和準確率的度量方法來克服這個弊端,我們可以考慮非相關文件在文件集中的比重,因為在乙個真實的檢索系統中,非相關文件總是遠遠大於相關文件,在此定義乙個新的召回率和準確率公式,以不相關文件與總文件數的比值作為係數。公式如下:
新召回率=召回率*(不相關文件數/總文件數)
確率=準確率*(不相關文件數/總文件數)
我們用新的公式再來計算一下這兩個檢索系統的召回率和準確率,則
第乙個系統的
新召回率=40%*(90/100) = 40%*90% = 36%
新準確率=50%*(90/100) = 50%*90 = 45%
第二個系統的
新召回率=40%*(9990/10000) = 40%*99.9%=39.6%
新準確率=50%*(9990/10000) = 50%*99.9%=49.5%
從新的公式來看,第二個系統的召回率和準確率都要比第乙個系統要高,體現出來這種差別。
關於召回率和準確率的理解
知道意思,但是有時候要很清晰地向同學介紹則有點轉不過彎來。召回率和準確率是資料探勘中 網際網路中的搜尋引擎等經常涉及的兩個概念和指標。召回率 recall,又稱 查全率 還是查全率好記,也更能體現其實質意義。準確率 precision,又稱 精度 正確率 以檢索為例,可以把搜尋情況用下圖表示 相關 ...
關於召回率和準確率的理解
知道意思,但是有時候要很清晰地向同學介紹則有點轉不過彎來。召回率和準確率是資料探勘中 網際網路中的搜尋引擎等經常涉及的兩個概念和指標。召回率 recall,又稱 查全率 還是查全率好記,也更能體現其實質意義。準確率 precision,又稱 精度 正確率 以檢索為例,可以把搜尋情況用下圖表示 相關 ...
廣告召回率是什麼意思 準確率 精確率 召回率的含義
最近在看機器學習的,要理解準確率 精確率 召回率的含義,首先要理解 tp fn ft 和 tn 的含義。tp fn ft 和 tn 這幾個概念一直搞得不太清楚。記錄一下。看了別人的文章,舉的例子不是太好,不太容易理解 假設有100個人,實際上50個人喝酒了,50個人沒喝。我們有乙個判定是否喝酒的模型...