分類模型的評估方法 F分數 F Score

2021-10-03 16:20:02 字數 1245 閱讀 5067

前面介紹了機器學習中分類模型的精確率(precision)召回率(recall)評估指標。對於precision和recall,雖然從計算公式來看,並沒有什麼必然的相關性關係,但是,在大規模資料集合中,這2個指標往往是相互制約的。理想情況下做到兩個指標都高當然最好,但一般情況下,precision高,recall就低,recall高,precision就低。所以在實際中常常需要根據具體情況做出取捨,例如一般的搜尋情況,在保證召回率的條件下,盡量提公升精確率。而像癌症檢測、**檢測、金融欺詐等,則在保證精確率的條件下,盡量提公升召回率。

所以,很多時候我們需要綜合權衡這2個指標,這就引出了乙個新的指標f-score。這是綜合考慮precision和recall的調和值。 f−

scor

e=(1

+β2)

⋅pre

cisi

on⋅r

ecal

lβ2⋅

prec

isio

n+re

call

f−score=(1+β2)⋅precision⋅recallβ2⋅precision+recall當β

=1β=1的值大於1。

舉個例子:癌症檢查資料樣本有10000個,其中10個資料祥本是有癌症,其它是無癌症。假設分類模型在無癌症資料9990中**正確了9980個,在10個癌症資料中**正確了9個,此時真陽=9,真陰=9980,假陽=10,假陰=1。

那麼:

accuracy = (9+9980) /10000=99.89%

precision=9/19+10)= 47.36%

f1-score=2×(47.36% × 90%)/(1×47.36%+90%)=62.07%

f2-score=5× (47.36% × 90%)/(4×47.36%+90%)=76. 27%

前面介紹了機器學習中分類模型的精確率(precision)召回率(recall)評估指標。對於precision和recall,雖然從計算公式來看,並沒有什麼必然的相關性關係,但是,在大規模資料集合中,這2個指標往往是相互制約的。理想情況下做到兩個指標都高當然最好,但一般情況下,precision高,recall就低,recall高,precision就低。所以在實際中常常需要根據具體情況做出取捨,例如一般的搜尋情況,在保證召回率的條件下,盡量提公升精確率。而像癌症檢測、**檢測、金融欺詐等,則在保證精確率的條件下,盡量提公升召回率。

分類模型的評估方法簡介

一 混淆矩陣 混淆矩陣 confusion matrix 於資訊理論,在機器學習 人工智慧領域,混淆矩陣 confusion matrix 又稱為可能性 或是錯誤矩陣,是一種用矩陣呈現的視覺化工具,用於有監督學習,無監督學習通常用匹配矩陣 matching matrix 其名字源自它容易表明多個類是...

分類模型的評估

1.混淆矩陣 對於乙個分類器 二分類 結果和真實情況總共存在四種情況,值分為正類 負類,真實值分分為正類 父類,兩兩組合,共有四種情況,如下所示,即組成乙個混淆矩陣 針對多分類問題,真實情況有n類,情況有n類,所以其混淆矩陣為nxn 準確率即為所有 正確的樣本 樣本總數 即 accuracy tp ...

模型評估的方法

一 回歸模型評估 1 mse 均方誤差 sklearn.metrics.mean squared error y test,y predict 二 分類模型評估 1 accuracy score分類準確率分數 正確的樣本數目佔總體的比例 正確的樣本數目 正例 正確的 負例 正確的樣本數 注 如果乙個...