有時候神經網路最後的擬合效果不好,可能不是網路結構的問題,而是沒有對原資料進行預處理。資料預處理對神經網路的效能影響很大。
資料分為兩種:離散和連續。離散的資料型別有星期、性別(0,1)。連續的資料型別有諸如年齡、身高等。
1.離散的資料一般用one-hot來預處理。例如一年有四季,這四季可以分別用0,1,2,3來表示,但是並不代表3代表的季節比0好,所以不能直接將其輸入進神經網路。如果用one-hot來處理,0,1,2,3就分別變為了(1,0,0,0),(0,1,0,0),(0,0,1,0),(0,0,0,1)。採用one-hot編碼,只有乙個數字為1,其餘都為0。其中1表示啟用。
2.連續型別的資料有很多預處理的方法。我一般用的是均值標準化:將資料減去平均值之後再除以方差。如下式:
還有max-min方法等可以對連續值進行預處理。
神經網路在多分類上的應用 資料預處理
標籤 神經網路 多分類 目錄訓練資料集和測試資料集的劃分 主要工具 pandasmatplotlibseabornnumpysklearn feature1 feature2 feature3 feature4 class 5.11400 1.42 04.9 1200 1.42 04.7 1280 ...
關於搭建神經網路
有這麼幾個坑 首先,loss函式真的超級重要!隨神經網路層數的不同,loss函式也應該發生變化。比如我把莫煩python教程mnist的那個例子直接搬下來之後加了一層,正確率直線下降,找不到原因,到網上又找了個 一點一點改,發現把loss函式改掉之後正確率也基本上跟沒訓練差不多了。比如loss後面用...
卷積神經網路文字輸入 使用卷積神經網路進行文字分類
cnn 是卷積神經網路,通常用於影象領域,並且在影象分類取得非常好的效果。2014 年 yoon kim 在 convolutional neural networks for sentence classification 中將 cnn 的思想應用到文字處理中,後續很多把 convnet 用在 n...