深度學習筆記(15) 人的表現

2021-09-24 04:39:17 字數 2312 閱讀 7779

所以在這些場合,比較人類和機器是很自然的,或者是要讓機器模仿人類的行為

x 軸是時間,當開始往人類水平努力時,進展是很快的

但是過了一段時間,當這個演算法表現比人類更好時,那麼進展和精確度的提公升就變得更慢了

隨著時間的推移

當繼續訓練演算法時,可能模型越來越大,資料越來越多

但效能是無法超過某個理論值上限

這就是貝葉斯最優錯誤率(bayes optimal error)

貝葉斯最優錯誤率有時寫作bayesian,即省略optimal

就是從x到y對映的理論最優函式,永遠不會被超越

所以這紫色線

無論在乙個問題上工作多少年,永遠不會超越貝葉斯錯誤率,貝葉斯最佳錯誤率

有兩個原因,為什麼當超越人類的表現時,進展會慢下來

用貓分類器來做例子,比如人類具有近乎完美的準確度,所以人類水平的錯誤是1%

在這種情況下,如果學習演算法達到8%的訓練錯誤率和10%的開發錯誤率

演算法在訓練集上的表現和人類水平的表現有很大差距的話

說明演算法對訓練集的擬合併不好

所以從減少偏差和方差的工具這個角度看,在這種情況下,應把重點放在減少偏差上

需要做的是,比如說訓練更大的神經網路,或者梯度下降久一點

但也許資料集中的影象非常模糊

即使人類都無法判斷這張**中有沒有貓,假設人類水平錯誤實際上是7.5%

此時系統在訓練集上的表現還好,它只是比人類的表現差一點點,沒有太多改善的空間了

不能繼續減少訓練錯誤率了

但訓練誤差和開發誤差之間有更多的改進空間

可以將這個2%的差距縮小一點,使用減少方差的手段

比如正則化,或者收集更多的訓練資料

貝葉斯錯誤率或者對貝葉斯錯誤率的估計和訓練錯誤率之間的差值稱為可避免偏差

這理論上是不可能超過貝葉斯錯誤率的,除非過擬合

而訓練錯誤率和開發錯誤率之前的差值

就大概說明演算法在方差問題上還有多少改善空間

在醫學影象診斷例子中,要觀察這樣的放射科影象並做出分類診斷

假設普通的人類,未經訓練的人類,在此任務上達到3%的錯誤率

普通的醫生,也許是普通的放射科醫生,能達到1%的錯誤率

經驗豐富的醫生做得更好,錯誤率為0.7%

還有一隊經驗豐富的醫生,討論並辯論,達成共識的意見達到0.5%的錯誤率

假如系統的訓練錯誤率是5%,開發錯誤率是6%,

可避免偏差大概是2%,4%,4.3%,4.5%,這明顯比都比方差問題1%大

所以在這種情況下,應該專注於減少偏差的技術,例如培訓更大的網路

所以此時貝葉斯錯誤率小於等於0.5%,最優錯誤率必須在0.5%以下

比如系統的訓練錯誤率是0.7%,所以你現在已經做得很好了

開發錯誤率是0.8%,在這種情況下,用0.5%來估計貝葉斯錯誤率關係就很大

因為在這種情況下,可避免偏差是0.2%,是方差問題0.1%的兩倍

這表明也許偏差和方差都存在問題,但可避免偏差問題更嚴重

如果用0.7%代替貝葉斯錯誤率,可避免偏差基本上是0%,那就可能忽略可避免偏差了

實際上應該試試能不能在訓練集上做得更好

更好的估計貝葉斯錯誤率,可以幫助更好地估計可避免偏差和方差

能夠更好的做出減少偏差或減少方差的策略

一組人類專家充分討論辯論之後,達到0.5%的錯誤率,單個人類專家錯誤率是1%

訓練出來的演算法0.6%的訓練錯誤率,0.8%的開發錯誤率

可避免偏差的估計是至少0.1%,然後方差是0.2%

和減少可避免偏差比較起來,減少方差可能空間更大

但出來的演算法0.3%訓練錯誤率,還有0.4%開發錯誤率

這是否意味著過擬合了0.2%,或者說貝葉斯錯誤率其實是0.1%呢?或者也許貝葉斯錯誤率是0.2%?

真的不知道

實際上沒有足夠的資訊來判斷優化演算法時應該專注減少偏差還是減少方差

這樣進展效率就會降低

所以要達到超越人類的表現往往不容易

但如果有足夠多的資料,已經有很多深度學習系統,在單一監督學習問題上已經超越了人類的水平

所以這對開發的應用是有意義的

減少可避免偏差的策略:

減少方差的策略:

參考:

深度學習筆記(42) 人臉識別

現在可以看到很多產品在運用人臉識別,如手機解鎖 車站身份識別認證 刷臉支付等 在人臉識別的相關文獻中,人們經常提到 有時候也被稱作1對1問題 只需要弄明白這個人是否和他聲稱的身份相符 而人臉識別問題比人臉驗證問題難很多 因為這是1對多問題 1 k 假設有乙個驗證系統,準確率是99 自我感覺還可以 但...

學習筆記15

響應式 media 不同的大小 執行不行的css 寫上 float left 預設不會屏佔百分百,寫上多少就是多少 但是無法滿足全屏鋪滿 min left 900x 的意思是 當寬度小於這個值時候 底部出現滾動條 position absolute 這麼寫 會鋪滿螢幕 只有加上 left right...

學習筆記 15

簡單來說,對於 abac 我們判斷乙個使用者是否能訪問某項資源,是對其很多不同屬性的計算而得到的。訪問控制 訪問控制是資料安全的乙個基本組成部分,它規定了哪些人可以訪問和使用公司資訊與資源。通過身份驗證和授權,訪問控制策略可以確保使用者的真實身份,並且擁有訪問公司資料的相應許可權。訪問控制還適用於限...