最近在對10750個漢字做分類,使用resnet50為基本框架,分類部分多加了乙個線性層,每個漢字作為1類。損失函式是交叉熵函式。
類別太多的話,網路一開始不易學習到。使用sgd的話好像根本沒法學習。
我使用adadelta (lr=0.01) 從頭開始訓練,雖然結果可以達到92%,但是檢視網路輸出的得分發現值相當異常,全部都是小於-30,000。這也導致了最後的分類層的梯度值相當大,最終導致訓練不好(沒法把loss降到很低)。
目前是先用adadelta從頭訓練,可以選擇當loss降到5一下時,換用adam (lr=1e-3),這樣網路輸出的分數值就會變得正常了,而且loss下降得很好。
最後也可以用sgd微調引數。
有空一定要好好研究一下這些優化器的原理。
針對UCWEB的一些開發
ucweb瀏覽器,支援viewstate,但裡面的內容不能太長,否則會報錯。imagebutton的話,提交同樣也對應不上它的onclick事件。並且似乎也不能確定是不是它觸發的提交15 08 protected void page load object sender,eventargs e el...
針對VC中的一些基礎知識記錄
1 windows使用訊息機制的原因 首先使用訊息機制優於函式呼叫,因為訊息是物理資料,可以很方便的排隊和賦予優先順序。當乙個時間發生時,可以講該事件的訊息放入佇列,使得所有的訊息能以有序的方式進行處理。其次,訊息不依賴於處理器型別。其相容性很好 最後,訊息不依賴於特定的程式語言。使用各種語言編寫的...
boost spirit 的一些記錄
最近的工作跟 boost spirit 多一些,本來想整理乙個較為系統的筆記,不過感覺目前思路還比較凌亂,先隨便記錄一些。spirit 是 boost 中的乙個 ll解析器框架,他完成實現乙個 ebnf 語法解析器的功能,但它的輸入為c 語言。ll parser framework represen...