所謂歸一化(normalization)處理。

2021-08-19 23:30:52 字數 530 閱讀 6423

如題,無非就是把多組資料按照一定的格式轉化,翻譯成標準化應該更恰當,或者說歸一化只是標準化的方法其中之一。

其中最近,使用把影象畫素值收縮[0,1]區間,

matlab有現成函式,mapminmax。

整個過程無非就是老區間和新區間,資料的區間長度得轉化,而資料在區間的位置不變。

所以,mapminmax使用的轉化就是按照數值的區間位置為基準。

matlab函式的公式,

這部分就是計算老區間的資料位置,分子是資料值,也可以說是其中乙個資料長度,減去xmin是因為資料的最小值不一定是0,為了計算位置必須要把最小值偏移掉;分母是整個資料區間長度。所以兩者算出每個資料在區間的比例位置,就是得出每個資料長度占有總區間長度的百分比。

其他就好理解了,把乙個資料長度的百分比,乘上新的區間長度,再加上ymin的偏移,就得到了縮放後的新資料。

機器學習之特徵歸一化(normalization)

一 引子 對房屋售價進行 時,我們的特徵僅有房屋面積一項,但是,在實際生活中,臥室數目也一定程度上影響了房屋售價。下面,我們有這樣一組訓練樣本 房屋面積 英呎 臥室數量 間 售價 美元 2104 3 399900 1600 3 329900 2400 3 369000 1416 2 232000 3...

特徵歸一化的方法 線性歸一化 零均值歸一化

常用歸一化方法 1 線性歸一化,線性歸一化會把輸入資料都轉換到 0 1 的範圍,公式如下 該方法實現對原始資料的等比例縮放,其中xnorm為歸一化後的資料,x為原始資料,xmax xmin分別為原始資料集的最大值和最小值。優點 通過利用變數取值的最大值和最小值將原始資料轉換為界於某一特定範圍的資料,...

資料歸一化

近來,在網上搜了很多關於資料歸一化的帖子,看了太多,很雜,這裡整理總結一下 歸一化是一種資料預處理方法,就是要把你需要處理的資料經過處理後 通過某種演算法 限制在你需要的一定範圍內,為了後面資料處理的方便,其次是保正程式執行時 收斂加快。比如說,對於奇異樣本資料 所謂奇異樣本資料資料指的是相對於其他...