caffe的solver的引數的含義和設定

2021-08-03 20:05:56 字數 1193 閱讀 3656

caffe的solver的引數的含義和設定:

batchsize:每迭代一次,網路訓練的數量,例如:如果你的batchsize=256,則你的網路每迭代一次,訓練256張;

則,如果你的總張數為1280000張,則要想將你所有的通過網路訓練一次,則需要1280000/256=5000次迭代。

epoch:表示將所有在你的網路中訓練一次所需要的迭代次數,如上面的例子:5000次;我們稱之為一代。所以如果你想要你的網路訓練100代時,則你的總的迭代次數為max_iteration=5000*100=500000次;

max_iteration:網路的最大迭代次數如上面的500000次;同理,如果max_iteration=450000,則該網路被訓練450000/5000=90代。

test_iter

表示測試的次數;比如,你的test階段的batchsize=100,而你的測試資料為10000張,則你的測試次數為10000/100=100次;即,你的

test_iter

=100;

test_interval:表示你的網路迭代多少次才進行一次測試,你可以設定為網路訓練完一代,就進行一次測試,比如前面的一代為5000次迭代時,你就可以設定test_interval=5000;

base_lr

:表示基礎學習率,在引數梯度下降優化的過程中,學習率會有所調整,而調整的策略就可通過lr_policy這個引數進行設定;

影響著資料的收斂,step的變化不能超過三次,0.01是起始的值,否則後面的訓練都沒有意義的,要不斷的調節這個base_lr,來看看結果!

lr_policy

學習率的調整策略:

momentum:

表示上一次梯度更新的權重;

weight_decay:

表示權重衰減,用於防止過擬合;

Caffe的solver引數介紹

solver.prototxt檔案是用來告訴caffe如何訓練網路的。solver.prototxt的各個引數的解釋如下 2.demo lr policy lr policy為multisetp base lr 0.01 momentum 0.9 lr policy multistep gamma ...

caffe的solver檔案引數詳解

solver檔案引數 test interval,test iter,max iter的區別 test interval 938 60000 64,測試間隔引數 訓練完一次所有的,進行一次測試 測試間隔就是完成一次完整的train需要的次數,train example train batch siz...

Caffe中求解器(Solver)介紹

求解器負責對模型優化,目的是使損失函式達到全域性最小。其類中包含乙個net的指標,主要是實現了訓練模型引數所採用的優化演算法,其派生類就可以對整個網路進行訓練。不同的模型訓練方法通過過載函式computeupdatevalue 實現計算update引數的核心功能。在進行整個網路訓練過程 即執行caf...