推薦的方法:
1. 開始乙個簡單的演算法,然後快速實現,在交叉驗證集上進行驗證
2. 畫出學習曲線,嘗試不同的方案
3. 誤差分析,手動檢查演算法錯誤的例子,看看是否存在系統性錯誤
最好有一種數值化評估演算法的方法,以便分析演算法的優劣
偏斜類:資料中乙個類別的量遠比另乙個的多,會導致學習器直接全部猜測為資料量大的類
true positive:**為正實際為正
true negative:**為負實際為負
false positive:**為正實際為負
false negative:**為負實際為正 pr
ecis
ion=
true
posi
tive
pred
icte
dpos
itiv
e pre
cisi
on=t
ruep
osit
ivep
redi
cted
posi
tive
=truep
osit
ivet
ruep
osit
ive+
fals
epos
itiv
e =tr
uepo
siti
vetr
uepo
siti
ve+f
alse
posi
tive
recall
=tru
epos
itiv
eact
ualp
osit
ive rec
all=
true
posi
tive
actu
alpo
siti
ve
=truep
osit
ivet
ruep
osit
ive+
fals
eneg
ativ
e =tr
uepo
siti
vetr
uepo
siti
ve+f
alse
nega
tive
在分類問題中,臨界值可以影響準確率和召回率,高準確率,低召回率,或者低準確率高召回率
評估演算法的時候,準確率和召回率的平均值並不好,可以使用調和平均值 f1
=2pr
p+r f1=
2prp
+r
吳恩達機器學習筆記
為了解決實際生活中的問題,我們通常需要乙個數學模型。比如,小明有乙個房子 他想賣掉房子 為了知道房子的 小明收集了該地區近兩年的房屋交易 他發現房屋 與房屋大小呈正相關,所以他畫了了一幅圖 小明的房屋大小用紅色的 代替。可見和小明房屋一樣大小的房子並不存在,而類似的房屋 又有很大差別,如此小明決定用...
吳恩達機器學習筆記
sigmoid啟用函式 0,1 x 0,y 0.5 tanh啟用函式 1,1 x 0,y 0 relu啟用函式 x 0,y 0 x 0,y x sigmoid啟用函式 除了輸出層是乙個二分類問題基本不會用它。tanh啟用函式 tanh是非常優秀的,幾乎適合所有場合。relu啟用函式 最常用的預設函式...
吳恩達機器學習筆記(4 正則化)
到目前為止,我們已經學習了兩個演算法,包括線性回歸和邏輯回歸。在實際問題中,有可能會遇到過擬合問題,它會導致效果很差。這一節,我們介紹一下什麼是過擬合,以及解決過擬合問題的方法,正則化。過擬合 如果我們有非常多的特徵,我們通過學習得到的假設可能能夠非常好地適應訓練集 代 價函式可能幾乎為 0 但是可...