caffe訓練過程中,訓練中斷之後,如何接著訓練?

2021-08-22 18:15:38 字數 1413 閱讀 8005

zxw.sh 

/home/tyn/downloads/center_loss_caffe/build/tools/caffe train -solver face_solver.prototxt --snapshot=center_loss_model_iter_9000.solverstate -gpu=all 2>&1 | tee double_label_centerloss_20575_0.02_train.log

center_loss_model_iter_9000.solverstate  #從這個模型開始訓練

double_label_centerloss_20575_0.02_train.log  #儲存的訓練日誌

感謝陶師姐教會我這麼多--雖然在她面前基本上沒有叫過師姐

有時候caffe在訓練的時候,因某種原因不得不暫停訓練,下次怎麼接著繼續訓練呢,下列sh指令碼檔案

#!/usr/bin/env sh

path=/home/ccf/ccf/data-me

/home/hjxu/caffe-master/caffe/build/tools/caffe train --solver=/home/hjxu/wsi-metastic/data-me/profile/solver.prototxt  \

--snapshot=/home/hjxu/wsi-metastic/data-me/model/caffe_breast_transfer_train_iter_95000.solverstate 2>&1|tee /home/hjxu/wsi-metastic/data-me/train2.txt

如果已經有了模型,想要第二次加強訓練

#!/usr/bin/env sh

path=/home/ccf/ccf/data-me

/home/hjxu/caffe-master/caffe/build/tools/caffe train --solver=/home/hjxu/wsi-metastic/data-me/profile/solver.prototxt  \

--weights=/home/hjxu/wsi-metastic/data-me/model/caffe_breast_transfer_train_iter_95000.caffemodel 2>&1|tee /home/hjxu/wsi-metastic/data-me/train2.txt

ubuntu下

如果我們在訓練途中停電或者有了其他的情況,可以通過之前儲存的狀態恢復資料,使用的時候直接新增–snapshot引數即可,如:

./build/tools/caffe train --solver=models/bvlc_reference_caffenet/solver.prototxt --snapshot=models/bvlc_reference_caffenet/caffenet_train_iter_10000.solverstate

Caffe訓練過程

1.caffe入門學習 筆記 1 直接訓練法 usr bin env sh tools cafferead build tools tools caffe train solver gender solver.prorotxt gpu all 加入 gpu 選項 gpu 可以選擇gpu的id號,如果...

的訓練過程 模型訓練過程中累計auc

在平時計算auc的時候,大都是使用 sklearn.metrics.roc auc score 來計算。一般操作是將每個batch 出來的結果 拼接起來,然後扔到該函式中計算。但是如果測試集量級過大 比如 10億量級 每個樣本的 結果拼接起來之後至少需要 3g記憶體。這個開銷顯然不是我們想要的。有什...

解決Caffe訓練過程中loss不變問題

這段在使用caffe的時候遇到了兩個問題都是在訓練的過程中loss基本保持常數值,特此記錄一下。loss等於87.33這個問題是在對inception v3網路不管是fine tuning還是train的時候遇到的,無論網路迭代多少次,網路的loss一直保持恆定。查閱相關資料以後發現是由於loss的...