正確率 召回率和 F 值

2022-04-23 06:09:10 字數 1907 閱讀 7746

原文:

1. 正確率 = 正確識別的個體總數 /  識別出的個體總數

2. 召回率 = 正確識別的個體總數 /  測試集中存在的個體總數

3. f值  = 正確率 * 召回率 * 2 / (正確率 + 召回率) (f 值即為正確率和召回率的調和平均值)

不妨舉這樣乙個例子:某池塘有1400條鯉魚,300只蝦,300只鱉。現在以捕鯉魚為目的。seaeagl e撒一大網,逮著了700條鯉魚,200只蝦,100只鱉。那麼,這些指標分別如下:

正確率 = 700 / (700 + 200 + 100) = 70%

召回率 = 700 / 1400 = 50%

f值 = 70% * 50% * 2 / (70% + 50%) = 58.3%

不妨看看如果 seaeagle 把池子裡的所有的鯉魚、蝦和鱉都一網打盡,這些指標又有何變化:

正確率 = 1400 / (1400 + 300 + 300) = 70%

召回率 = 1400 / 1400 = 100%

f值 = 70% * 100% * 2 / (70% + 100%) = 82.35%

由此可見,正確率是評估捕獲的成果中目標成果所佔得比例;召回率,顧名思義,就是從關注領域中,召回目標類別的比例;而 f 值,則是綜合這二者指標的評估指標,用於綜合反映整體的指標。

召回率召回率召回率(recall)和精度(precise)是廣泛用於資訊檢索和統計學分類領域的兩個度量值,用來評價結果的質量。其中召回率是是檢索出的相關文件數和文件庫中所有的相關文件數的比率,衡量的是檢索系統的查全率。精度是檢索出的相關文件數與檢索出的文件總數的比率,衡量的是檢索系統的查準率。

召回率和精度示意圖

recall

假定:從乙個大規模資料集合中檢索文件時,可把文件分成四組:

- 系統檢索到的相關文件(a)

- 系統檢索到的不相關文件(b)

- 相關但是系統沒有檢索到的文件(c)

- 不相關且沒有被系統檢索到的文件(d)

則:- 精度p:用檢索到相關文件數作為分子,所有檢索到的文件總數作為分母.即p = a / ( a + b ).

舉例來說:

乙個資料庫有500個文件,其中有50個文件符合定義的問題。系統檢索到75個文件,但是只有45個符合定義的問題。

召回率 r=45/50=90%

精度     p=45/75=60%

本例中,系統檢索是比較有效的,召回率為90%。但是結果有很大的噪音,有近一半的檢索結果是不相關。研究表明:在不犧牲精度的情況下,獲得乙個高召回率是很困難的。

對於乙個檢索系統來講,召回率和精度不可能兩全其美:召回率高時,精度低,精度高時,召回率低。所以常常用 11種召回率下 11 種精度的平均值來衡量乙個檢索系統的精度。我們也可以將這兩個度量值融合成乙個度量值,如 f度量 (f-measure)。對於搜尋引擎系統來講,因為沒有乙個搜尋引擎系統能夠蒐集到所有的 web 網頁,所以召回率很難計算。目前的搜尋引擎系統都非常關心精度

。影響乙個搜尋引擎系統的效能有很多因素,最主要的是資訊檢索模型,包括文件和查詢的表示方法、評價文件和使用者查詢相關性的匹配策略、查詢結果的排序方法和使用者進行相關度反饋的機制。

「召回率」 與 「準確率」 雖然沒有必然的關係,然而在大規模資料集合中,這兩個指標卻是相互制約的。

由於 「檢索策略」 並不完美,希望更多相關的文件被檢索到時,通常放寬 「檢索策略」 ,此時往往也會伴隨出現一些不相關的結果,從而使準確率受到影響。

而希望去除檢索結果中的不相關文件時,務必要將 「檢索策略」 定的更加嚴格,這樣也會使有一些相關的文件不再能被檢索到,從而使召回率受到影響。

凡是涉及到大規模資料集合的檢索和選取,都涉及到 「召回率」 和 「準確率」 這兩個指標。而由於兩個指標相互制約,我們通常也會根據需要為 「檢索策略」 選擇乙個合適的度,不能太嚴格也不能太鬆,尋求召回率和準確率中間的乙個平衡點。這個平衡點由具體需求決定。

正確率 召回率 F值

正確率 正確識別的個體總數 識別出的個體總數 召回率 正確識別的個體總數 測試集中存在的個體總數 f值 正確率 召回率 2 正確率 召回率 不妨舉這樣乙個例子 某池塘有1400條鯉魚,300只蝦,300只鱉。現在以捕鯉魚為目的。seaeagle撒一大網,逮著了700條鯉魚,200只蝦,100只鱉。那...

正確率 召回率和F值

其實這東西沒有必要非得記住怎麼定義的,需要用衡量指標的時候過來查一查就知道了,原文在這裡 正確率 召回率和f值是在魚龍混雜的環境中,選出目標的重要評價指標。不妨看看這些指標的定義先 正確率 正確識別的個體總數 識別出的個體總數 召回率 正確識別的個體總數 測試集中存在的個體總數 f值 正確率 召回率...

正確率 召回率和F值

正確率 召回率和f值是目標的重要評價指標。正確率 正確識別的個體總數 識別出的個體總數 召回率 正確識別的個體總數 測試集中存在的個體總數 f值 正確率 召回率 2 正確率 召回率 不妨舉這樣乙個例子 某池塘有1400條鯉魚,300只蝦,300只鱉。現在以捕鯉魚為目的。seaeagle撒一大網,逮著...