輸出變數y為離散的有限的值時,**問題稱為分類問題。學習得到的分類模型或者決策函式稱為分類器。
分類器效能評估的指標
準確率(accuracy):分類正確佔總樣本的比值,也可看著是0-1損失函式在測試集上的準確率
一般二分類問題多,評價指標主要是精確率,召回率,準確率
在測試集上
tp:正類被**為正類的數量
fn:正類被**為負類的數量
fp:負類被**為正類的數量
tn:負類被**為負類的數量
精確率(precision):所有**為正類的樣本中,**為正類且正確的比例
p=tp/(tp+np)
召回率(recall):所有正類的樣本中,**為正類且正確的比例
r=tp/(tp+fn)
f1值:精確率和召回率的調和均值,當p和r都很高時,f1才高
2/f=1/p+1/r
f=2tp/(2tp+fp+fn)
銀行分類模型:根據貸款風險大小進行分類。
二分類問題
模型 帶有relu啟用的dense層堆疊 對於二分類問題,網路的最後一層應該是只有乙個單元並使用sigmoid啟用的dense層,網路的輸出應該是0 1的標量,表示概率值 對於二分類問題的sigmoid標量輸出,應該使用binary crossentroy 二元交叉熵 損失函式 實驗 1 嘗試增加或...
二分類問題
深度學習中的基本問題就是這個,上午我還達到90 85 的acc,現在只有76 臥槽,我動 了啊?有鬼。明明沒怎麼改引數,卻再也回不到過去,這個trick不小啊。既然回不到過去,不妨重新開始吧。我套了一下vgg,發現網路太深了,根本跑不動,效果也不好,減少網路後,acc反而有提高,之前我還以為驗證集有...
機器學習(2) 分類問題
參考部落格 根據一些 feature 進行分類,每個節點提乙個問題,通過判斷,將資料分為兩類,再繼續提問。這些問題是根據已有資料學習出來的,再投入新資料的時候,就可以根據這棵樹上的問題,將資料劃分到合適的葉子上。個人總結 不能保證正確 一組資料的特徵用向量表示,比如 x1,x2,x3,x4 有4個特...