工程師訓練模型的完整步驟

2021-10-09 05:36:04 字數 514 閱讀 5407

①預處理資料

②模型選擇

對於影象生成文字,就需要cnn,後面接乙個rnn

對於文字分類,就需要選擇lstm,判斷需不需要加attention

對於生成模型,就需要選擇gan

③模型調參

首先是模型結構方面的調參,比如是不是應該加dropout,是不是應該加batchnorm,是不是要加skip-connection(resnet那樣的結構)

其次是在訓練過程中的調參,我的learning-rate應該是多大,我的batchsize應該是多大,優化器應該使用什麼,使用adam還是sgd等等

④模型後處理

模型訓練完之後,如果想讓它上線提供服務的話,還要對模型做一些處理,比如在tensorflow中,可以把graph給freed一下,給quantype一下,或者用一些模型壓縮的方法,使模型變得比較小,變得速度更快

機器學習之完整工程所需的步驟

最近在看hands on machine learning with scikit learn and tensorflow,其中提到機器學習處理解決乙個完成的任務需要的步驟,做個簡單記錄 機器學習完整工程大概有以下8個步驟 總覽問題和目標,希望得到什麼結果 獲取資料 探索資料,進一步獲取更深層次的...

推薦演算法工程師如何突破模型調研的瓶頸期?

筆者在我司一條核心業務中從事演算法類工作,整個組分為召回和排序兩個方向,從 2016 年 9 月排序方向剛開始成立時加入到團隊中。截止到 18 年底,圍繞著同乙個核心業務指標,我們經歷了從線性模型 基於統計性特徵的樹模型 基於大規模離散特徵的 fm 模型再到深度學習模型總共四個大版本的模型公升級迭代...

「全棧」工程師筆記 記乙個完整的專案流水賬

引語 相信很多人都自認為自己是個全棧工程師,不管有沒有驗證過,我也不例外。心中總有一種傲氣,事情都能做,只是做得好不好,時間夠不夠的問題!所以,對很多事情,我其實是一點不怕的,隨著時間的推移,人總是應該要進步的,去做一些沒做過的事,才對得起成長二字!剛好上上個月,公司有乙個新的專案需求,需要做乙個全...