資料探勘中正確率召回率和F值查全率和查準率

正確率、召回率和f值

是在魚龍混雜的環境中，選出目標的重要評價指標。

不妨看看這些指標的定義先：

正確率 = 正確識別的個體總數 / 識別出的個體總數

召回率 = 正確識別的個體總數 / 測試集中存在的個體總數

f值 = 正確率 * 召回率 * 2 / (正確率 + 召回率)

不妨舉這樣乙個例子：某池塘有1400條鯉魚，300只蝦，300只鱉。現在以捕鯉魚為目的。seaeagle撒一大網，逮著了700條鯉魚，200只蝦，100只鱉。那麼，這些指標分別如下：

正確率 = 700 / (700 + 200 + 100) = 70%

召回率 = 700 / 1400 = 50%

f值 = 70% * 50% * 2 / (70% + 50%) = 58.3%

不妨看看如果seaeagle把池子裡的所有的鯉魚、蝦和鱉都一網打盡，這些指標又有何變化：

正確率 = 1400 / (1400 + 300 + 300) = 70%

召回率 = 1400 / 1400 = 100%

f值 = 70% * 100% * 2 / (70% + 100%) = 82.35%

由此可見，正確率是評估捕獲的成果中目標成果所佔得比例；召回率，顧名思義，就是從關注領域中，召回目標類別的比例；而f值，則是綜合這二者指標的評估指標，用於綜合反映整體的指標。

查全率和查準率

一、查全率和查準率是目前衡量檢索效果的相對合理的指標

查全率＝（檢索出的相關資訊量/系統中的相關資訊總量）*100%

查準率＝（檢索出的相關資訊量/檢索出的資訊總量）*100%

前者是衡量檢索系統和檢索者檢出相關資訊的能力，後者是衡量檢索系統和檢索者拒絕非相關資訊的能力。兩者合起來，即表示檢索效率。

二、查全率和查準率都有侷限性

查全率的侷限性主要表現在：它是檢索出的相關資訊量與儲存在檢索系統中的全部相關資訊量之比，但系統中相關資訊量究竟有多少一般是不確知的，只能估計；另外，查全率或多或少具有「假設」的侷限性，這種「假設」是指檢索出的相關資訊對使用者具有同等價值，但實際並非如此，對於使用者來說，資訊的相關程度在某種意義上比它的數量重要得多。

查準率的侷限性主要表現在：如果檢索結果是題錄式而非全文式，由於題錄的內容簡單，使用者很難判斷檢索到的資訊是否與課題密切相關，必須找到該題錄的全文，才能正確判斷出該資訊是否符合檢索課題的需要；同時，查準率中所講的相關資訊也具有「假設」的侷限性。

實驗證明，在查全率和查準率之間存在著相反的相互依賴關係--如果提高輸出的查全率，就會降低其查準率，反之亦然。

對使用者來說，影響檢索效果的主要因素有文獻標引的廣泛性和使用者檢索標識的專指性。

資料探勘中正確率 召回率和F值 查全率和查準率

正確率 召回率 F值

正確率 召回率和F值

正確率 召回率和F值

相關推薦

資料探勘中正確率召回率和F值查全率和查準率

正確率召回率 F值

正確率召回率和F值

正確率召回率和F值