第三部分 機器學習 ML 策略2 4 筆記

2021-08-19 21:31:28 字數 1899 閱讀 5613

2.9 什麼是端到端的深度學習

what is end-to-end deep learning

一些資料處理系統以及學習系統往往需要多個階段的處理,而端到端的學習是忽略這些中間處理過程,用單個的神經網路來代替。

例子1 語音識別

傳統方式: 原始音訊 —> mfcc特徵提取 ——> 音位 ——> 文字

端到端:原始音訊 —————————————————> 文字

當資料集較小時,傳統方法往往較好;當資料量較大時,端到端的方式往往更加有效!

例子2 人臉識別門禁

任務: 拍攝影像x ——> 識別人物身份 ——> 是否放行

一步法:端到端的方法並非最好。

系統拆分:1、檢測出人臉位置,裁剪人臉影像,居中顯示;2、根據人臉影像訓練神經網路,用來識別是否是系統庫員工。

一步法的資料量很少,不利於訓練。而將系統拆分後,每個分系統均具有大量的訓練資料。

例子3 機器翻譯

傳統方式:英文句子 ——> 文字分析 。。。。——> 法語句子

端到端: 英文句子 —————————————> 法語句子

現今由於可以蒐集到大量的 英文-法文 資料集,因此在此例中,端到端的方式效果更好。

例子4 兒童年齡估計

傳統方式: x光影像 ——> 分割每塊骨頭 ——> 分辨每塊骨頭並量測長度——> 查統計表——>獲取年齡

端到端: x光影像 —————————————————————————————————> 年齡

如今,並沒有足夠的 影像-年齡 資料集,不足以支撐訓練出有效的端到端網路,此例中傳統方式往往更加有效。

因此端到端深度學習系統是可行的,它表現可以很好,也可以簡化系統架構,不需要搭建過多手工設計的單獨元件,但它也不是萬能的,並不是每次都能成功。

2.10 是否要使用端到端的深度學習

whether to use end-to-end learning

端到端學習的優缺點:

pros and cons:

pros:

只讓資料說話,讓計算機自己學習演算法;

減少手動設計的元件,簡化設計流程。

cons:

需要大量的資料,大量輸入端和輸出端成對兒的資料,這對有些任務而言是不現實的。

排除以一些可能有用的人工設計元件

演算法 = 資料 + 元件

資料量大,則人工元件可以減少;資料量小,則人工元件必須增加。

何時應用端到端學習??

在使用端到端深度學習之前,需要考慮的關鍵問題是:是否有足夠多的資料去學習從x對映到y的複雜函式(a function of the complexity)。

例子1 兒童年齡估計

並沒有足夠的 影像-年齡 資料集,不足以支撐訓練出有效的端到端網路,此例中傳統方式往往更加有效。

例子2 自動駕駛

輸入影像 ——> 方向盤角度 油門等 端到端的方式並非最佳非最有希望,不如更為複雜的多步方法。

雷射雷達、感測器影像等 ——> 檢測行人、車輛等,運動規劃,控制演算法 ——> 角度 油門等。

第三部分 機器學習 ML 策略1 6 筆記

1.11 超過人的表現 surpassing human level performance 例子 分類任務 case1 可以認為貝葉斯誤差為0.5 可避免偏差是0.1 方差是0.3 應該側重於調整方差。case2 訓練誤差以及開發誤差以及超過了人類水平,很難評價是該調整方差還是偏差,模型的精度肯定...

劇本第三部分

第三部分劇本 場景一 女生宿舍,a趴在桌子上睡覺,電腦螢幕亮著,是vs 但是就寫了一行 小碼趴在a的胳膊上睡著。突然,a醒了,發現自己上課要遲到了,a 哎呀,完了完了,大中午的怎麼趴在這睡著了 邊說話邊收拾書包 轉頭看向小碼 a 把你放哪呢 說話的時候四周環視 算了,跟我去吧,我先把你放書包裡 說話...

第三部分 效能

索引管理 效能優化 效能監控 db.c1.find explain 查詢的詳細資訊列出來 db.c1.getindexkyes 所有索引的字段 db.c1.getindexes 所有索引的相關資訊 2 唯一索引 只需要在ensureindex命令中提定 uniqure true 即可建立唯一索引,如...