查全率 召回率 與精度 查準率 之辨析

2021-08-31 07:49:42 字數 793 閱讀 3855

查全率[召回率]與精度[查準率] 之辨析:

召回率(recall rate)和精度(precision)定義:

從乙個大規模資料集合中檢索文件的時,可把文件分成四組

-系統檢索到的相關文件(a)

- 系統檢索到的不相關文件(b)

- 相關但是系統沒有檢索到的文件(c)

- 相關但是被系統檢索到的文件(d)相關

不相關

檢索到a

b

未檢索到c

d

直觀的說,乙個好的檢索系統檢索到的相關文件越多越好,不相關文件越少越好.

召回率和精度是衡量資訊檢索系統效能最重要的引數.

召回率r:用檢索到相關文件數作為分子,所有相關文件總數作為分母,即 r=a/(a+c)

精度p用檢索到相關文件數作為分子,所有檢索到的文件總數作為分母.即  p=a/(a+b).

下面舉例說明召回率和精度之間的關係:

乙個資料庫有500個文件, 其中有50個文件符合定義的問題.系統檢索到75個文件,但是只有45個符合定義的問題.

召回率      r=45/50=90%

精度      p=45/75=60%

本例中, 系統檢索是比較有效的,召回率為90%. 但是結果有很大的噪音, 有近一半的檢索結果是不相關. 研究表明: 在不犧牲精度的情況下,獲得乙個高召回率是很困難的.召回率越高,精度下降的很快,而且這種趨勢不是線性的.

趣談 錯誤率 精度 查準率 查全率

筆者剛開始學習ml dl,對於分類任務中的幾個效能度量指標,之前一直有點繞,今天看西瓜書時才明白,尤其是對於查準率與查全率部分,然後記錄下來預防後期自己忘掉。首先對於錯誤率很好理解,就是分類錯誤的樣本數佔總樣本數的比例,假設你有n個樣本,其中有f個樣本被錯誤分類,那麼錯誤率 p f n 錯誤率 於此...

查準率和召回率理解

問題 1.精確率是指檢索出的相關文件與檢索出的文件總數的比率,衡量的是檢索系統的查準率。簡單來說就是指檢索出來的條目有多少條是準確的。公式為 舉個例子,一座猴山里有100只猴子,50隻公猴子,50隻母猴子。現在需要抓出來公猴子,於是一共取出來30只猴子,其中公猴子有20只。那麼抓出公猴子的精準率就是...

召回率和精度

召回率 recall 和精度 precise 是廣泛用於資訊檢索和統計學分類領域的兩個度量值,用來評價結果的質量。其中召回率是是檢索出的相關文件數和文件庫中所有的相關文件數的比率,衡量的是檢索系統的查全率。精度是檢索出的相關文件數與檢索出的文件總數的比率,衡量的是檢索系統的查準率。從乙個大規模資料集...