1.11 超過人的表現
surpassing human-level performance
例子 分類任務
case1:可以認為貝葉斯誤差為0.5%,可避免偏差是0.1%,方差是0.3%,應該側重於調整方差。
case2:訓練誤差以及開發誤差以及超過了人類水平,很難評價是該調整方差還是偏差,模型的精度肯定還是可以進一步改進的,但是並不清楚最優貝葉斯誤差是多少,在演算法調整的方向上會變得不清晰,這也就意味著在超過人類水平,演算法改進難度增加。
機器學習超過人類水平的領域:
注:上述四個領域,採用的資料多是結構化資料(structural data),而且並非自然感知問題,即非計算機視覺、語音識別、nlp問題。人類在自然感知問題上會很在行。並且在處理上述問題時,可以獲取並訪問到大量的資料,可能比任何人能夠獲取的資料還要多。
1.12 改善你的模型表現
improving your model performance
乙個監督學習演算法達到實用,需要滿足兩個前提:
針對訓練集,模型擬合的足夠好 —— 低可避免偏差
模型在開發集和測試集上泛化能力較強 —— 方差不能太大
提公升機器學習系統的策略:
低偏差 訓練更大的模型
增加訓練時間
使用更好的優化演算法
新的網路架構 (rnn、cnn etc.)
超參搜尋
低方差 更多的資料
正則化 —— l2 、dropout 、 data augmentation ...
新的網路架構
超參搜尋
第三部分 機器學習 ML 策略2 4 筆記
2.9 什麼是端到端的深度學習 what is end to end deep learning 一些資料處理系統以及學習系統往往需要多個階段的處理,而端到端的學習是忽略這些中間處理過程,用單個的神經網路來代替。例子1 語音識別 傳統方式 原始音訊 mfcc特徵提取 音位 文字 端到端 原始音訊 文...
劇本第三部分
第三部分劇本 場景一 女生宿舍,a趴在桌子上睡覺,電腦螢幕亮著,是vs 但是就寫了一行 小碼趴在a的胳膊上睡著。突然,a醒了,發現自己上課要遲到了,a 哎呀,完了完了,大中午的怎麼趴在這睡著了 邊說話邊收拾書包 轉頭看向小碼 a 把你放哪呢 說話的時候四周環視 算了,跟我去吧,我先把你放書包裡 說話...
第三部分 效能
索引管理 效能優化 效能監控 db.c1.find explain 查詢的詳細資訊列出來 db.c1.getindexkyes 所有索引的字段 db.c1.getindexes 所有索引的相關資訊 2 唯一索引 只需要在ensureindex命令中提定 uniqure true 即可建立唯一索引,如...