《深度學習網路訓練 第一講》資料採集與資料預處理

2021-08-28 02:18:36 字數 352 閱讀 4376

經過專案的實踐,我感受到要想訓練出乙個效能優良的模型網路,資料採集與預處理是多麼的艱難與重要。

資料的採集是乙個費時費力的過程。對於人臉資料來說,針對產品的應用場景,需要採集不同環境變數的人臉影象。對於我的經驗來說,公司想要做乙個人臉識別的ai產品,採集人臉的時候,往往採用發動全公司員工積極配合採集人臉,但是這樣的人臉資料往往多樣性比較差,也就是說人頭個數沒有多少,但是乙個人可以採集多張不同角度和不同光照條件下的人臉影象。如果採用深度學習的方法來做,這樣的資料集往往是不合格的,多樣性不夠,人臉數量也不夠多。為了能夠應用深度學習演算法,可以有兩種方法擴充資料集:

1) 摻入公開資料集

2) 資料增強。也就是對每一張人臉進行旋轉,白化等操作。

深度學習 網路訓練技巧

1.1 學習率 learning rate 學習率 是控制模型學習效率 步長 的權重。學習率的大小區分區別 學習率大 學習率小 學習速度快慢 應用場合 訓練初期 數次epoch過後 缺點1.容易損失過大 2.容易發生振盪 1.容易過擬合 2.收斂速度慢 學習率的設定 在訓練過程中,一般根據訓練輪數設...

PCB學習第一講

第一講 概述 印刷電路板 pcb 的設計,是用來安裝,固定各個實際電器元件,並用銅箔走線實現其正確連線關係的一塊基板,是工廠加工製作的基礎。啟動pcb編輯器 設定工作環境 新增 net 設計pcb設計規則 放置元件並布局 pcb佈線 設計規則檢查 生成net 檔案儲存並列印 對於封裝的定義 元件的封...

機器學習 第一講

在監督學習中,我們給出資料組,並且已經知道正確的輸出是什麼樣,明確輸入和輸出之間的關係。監督學習問題可以歸類為回歸 regression 和分類 classification 問題。在回歸問題上,我們嘗試 乙個連續 continuous 的輸出結果,也就是說我們嘗試去map輸入變數到一些連續的方程。...