2.9 什麼是端到端的深度學習
what is end-to-end deep learning
一些資料處理系統以及學習系統往往需要多個階段的處理,而端到端的學習是忽略這些中間處理過程,用單個的神經網路來代替。
例子1 語音識別
傳統方式: 原始音訊 —> mfcc特徵提取 ——> 音位 ——> 文字
端到端:原始音訊 —————————————————> 文字
當資料集較小時,傳統方法往往較好;當資料量較大時,端到端的方式往往更加有效!
例子2 人臉識別門禁
任務: 拍攝影像x ——> 識別人物身份 ——> 是否放行
一步法:端到端的方法並非最好。
系統拆分:1、檢測出人臉位置,裁剪人臉影像,居中顯示;2、根據人臉影像訓練神經網路,用來識別是否是系統庫員工。
一步法的資料量很少,不利於訓練。而將系統拆分後,每個分系統均具有大量的訓練資料。
例子3 機器翻譯
傳統方式:英文句子 ——> 文字分析 。。。。——> 法語句子
端到端: 英文句子 —————————————> 法語句子
現今由於可以蒐集到大量的 英文-法文 資料集,因此在此例中,端到端的方式效果更好。
例子4 兒童年齡估計
傳統方式: x光影像 ——> 分割每塊骨頭 ——> 分辨每塊骨頭並量測長度——> 查統計表——>獲取年齡
端到端: x光影像 —————————————————————————————————> 年齡
如今,並沒有足夠的 影像-年齡 資料集,不足以支撐訓練出有效的端到端網路,此例中傳統方式往往更加有效。
因此端到端深度學習系統是可行的,它表現可以很好,也可以簡化系統架構,不需要搭建過多手工設計的單獨元件,但它也不是萬能的,並不是每次都能成功。
2.10 是否要使用端到端的深度學習
whether to use end-to-end learning
端到端學習的優缺點:
pros and cons:
pros:
只讓資料說話,讓計算機自己學習演算法;
減少手動設計的元件,簡化設計流程。
cons:
需要大量的資料,大量輸入端和輸出端成對兒的資料,這對有些任務而言是不現實的。
排除以一些可能有用的人工設計元件
演算法 = 資料 + 元件
資料量大,則人工元件可以減少;資料量小,則人工元件必須增加。
何時應用端到端學習??
在使用端到端深度學習之前,需要考慮的關鍵問題是:是否有足夠多的資料去學習從x對映到y的複雜函式(a function of the complexity)。
例子1 兒童年齡估計
並沒有足夠的 影像-年齡 資料集,不足以支撐訓練出有效的端到端網路,此例中傳統方式往往更加有效。
例子2 自動駕駛
輸入影像 ——> 方向盤角度 油門等 端到端的方式並非最佳非最有希望,不如更為複雜的多步方法。
雷射雷達、感測器影像等 ——> 檢測行人、車輛等,運動規劃,控制演算法 ——> 角度 油門等。
第三部分 機器學習 ML 策略1 6 筆記
1.11 超過人的表現 surpassing human level performance 例子 分類任務 case1 可以認為貝葉斯誤差為0.5 可避免偏差是0.1 方差是0.3 應該側重於調整方差。case2 訓練誤差以及開發誤差以及超過了人類水平,很難評價是該調整方差還是偏差,模型的精度肯定...
劇本第三部分
第三部分劇本 場景一 女生宿舍,a趴在桌子上睡覺,電腦螢幕亮著,是vs 但是就寫了一行 小碼趴在a的胳膊上睡著。突然,a醒了,發現自己上課要遲到了,a 哎呀,完了完了,大中午的怎麼趴在這睡著了 邊說話邊收拾書包 轉頭看向小碼 a 把你放哪呢 說話的時候四周環視 算了,跟我去吧,我先把你放書包裡 說話...
第三部分 效能
索引管理 效能優化 效能監控 db.c1.find explain 查詢的詳細資訊列出來 db.c1.getindexkyes 所有索引的字段 db.c1.getindexes 所有索引的相關資訊 2 唯一索引 只需要在ensureindex命令中提定 uniqure true 即可建立唯一索引,如...