資料歸一化

2021-08-17 06:25:34 字數 2216 閱讀 2870

標準差歸一化

對數歸一化

反餘切歸一化

mapminmax

適用於:把原來資料等比例縮放限定在某一範圍內,在不涉及距離度量和協方差計算的時候使用。

適用於:原來資料近似高斯分布。同時是距離度量的。

matlab_minmax_data是處理後的矩陣,s1為mapminmax操作的索引,可以輸出檢視。minmax_data是處理前的資料。

python實現

def max_min_normalization(data_value, data_col_max_values, data_col_min_values):

""" data normalization using max value and min value

args:

data_value: the data to be normalized

data_col_max_values: the maximum value of data's columns

data_col_min_values: the minimum value of data's columns

"""data_shape = data_value.shape

data_rows = data_shape[0]

data_cols = data_shape[1]

for i in xrange(0, data_rows, 1):

for j in xrange(0, data_cols, 1):

data_value[i][j] = \

(data_value[i][j] - data_col_min_values[j]) / \

(data_col_max_values[j] - data_col_min_values[j])

def standard_deviation_normalization(data_value, data_col_means,

data_col_standard_deviation):

""" data normalization using standard deviation

args:

data_value: the data to be normalized

data_col_means: the means of data's columns

data_col_standard_deviation: the variance of data's columns

"""data_shape = data_value.shape

data_rows = data_shape[0]

data_cols = data_shape[1]

for i in xrange(0, data_rows, 1):

for j in xrange(0, data_cols, 1):

data_value[i][j] = \

(data_value[i][j] - data_col_means[j]) / \

data_col_standard_deviation[j]

def nonlinearity_normalization_lg(data_value_after_lg,

data_col_max_values_after_lg):

""" data normalization using lg

args:

data_value_after_lg: the data to be normalized

data_col_max_values_after_lg: the maximum value of data's columns

"""data_shape = data_value_after_lg.shape

data_rows = data_shape[0]

data_cols = data_shape[1]

for i in xrange(0, data_rows, 1):

for j in xrange(0, data_cols, 1):

data_value_after_lg[i][j] = \

data_value_after_lg[i][j] / data_col_max_values_after_lg[j]

資料歸一化

近來,在網上搜了很多關於資料歸一化的帖子,看了太多,很雜,這裡整理總結一下 歸一化是一種資料預處理方法,就是要把你需要處理的資料經過處理後 通過某種演算法 限制在你需要的一定範圍內,為了後面資料處理的方便,其次是保正程式執行時 收斂加快。比如說,對於奇異樣本資料 所謂奇異樣本資料資料指的是相對於其他...

資料歸一化

如果對神經網路的 輸入和 輸出數 據進行 一定的 預處理 可以加快網路的訓練速 度 matlab 中 提供的預 處理方 法有歸一化處理 將每組資料都變為 1 至 1 之 間數 所涉及 的函式有 premnmx postmnmx tramnmx 標準化處理 將每組資料都為均 值為 0,方 差 為 1 ...

資料歸一化

資料標準化 歸一化 處理是資料探勘的一項基礎工作,不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到資料分析的結果,為了消除指標之間的量綱影響,需要進行資料標準化處理,以解決資料指標之間的可比性。原始資料經過資料標準化處理後,各指標處於同一數量級,適合進行綜合對比評價。以下是兩種常用的歸一...