標準差歸一化
對數歸一化
反餘切歸一化
mapminmax
適用於:把原來資料等比例縮放限定在某一範圍內,在不涉及距離度量和協方差計算的時候使用。
適用於:原來資料近似高斯分布。同時是距離度量的。
matlab_minmax_data是處理後的矩陣,s1為mapminmax操作的索引,可以輸出檢視。minmax_data是處理前的資料。
python實現
def max_min_normalization(data_value, data_col_max_values, data_col_min_values):
""" data normalization using max value and min value
args:
data_value: the data to be normalized
data_col_max_values: the maximum value of data's columns
data_col_min_values: the minimum value of data's columns
"""data_shape = data_value.shape
data_rows = data_shape[0]
data_cols = data_shape[1]
for i in xrange(0, data_rows, 1):
for j in xrange(0, data_cols, 1):
data_value[i][j] = \
(data_value[i][j] - data_col_min_values[j]) / \
(data_col_max_values[j] - data_col_min_values[j])
def standard_deviation_normalization(data_value, data_col_means,
data_col_standard_deviation):
""" data normalization using standard deviation
args:
data_value: the data to be normalized
data_col_means: the means of data's columns
data_col_standard_deviation: the variance of data's columns
"""data_shape = data_value.shape
data_rows = data_shape[0]
data_cols = data_shape[1]
for i in xrange(0, data_rows, 1):
for j in xrange(0, data_cols, 1):
data_value[i][j] = \
(data_value[i][j] - data_col_means[j]) / \
data_col_standard_deviation[j]
def nonlinearity_normalization_lg(data_value_after_lg,
data_col_max_values_after_lg):
""" data normalization using lg
args:
data_value_after_lg: the data to be normalized
data_col_max_values_after_lg: the maximum value of data's columns
"""data_shape = data_value_after_lg.shape
data_rows = data_shape[0]
data_cols = data_shape[1]
for i in xrange(0, data_rows, 1):
for j in xrange(0, data_cols, 1):
data_value_after_lg[i][j] = \
data_value_after_lg[i][j] / data_col_max_values_after_lg[j]
資料歸一化
近來,在網上搜了很多關於資料歸一化的帖子,看了太多,很雜,這裡整理總結一下 歸一化是一種資料預處理方法,就是要把你需要處理的資料經過處理後 通過某種演算法 限制在你需要的一定範圍內,為了後面資料處理的方便,其次是保正程式執行時 收斂加快。比如說,對於奇異樣本資料 所謂奇異樣本資料資料指的是相對於其他...
資料歸一化
如果對神經網路的 輸入和 輸出數 據進行 一定的 預處理 可以加快網路的訓練速 度 matlab 中 提供的預 處理方 法有歸一化處理 將每組資料都變為 1 至 1 之 間數 所涉及 的函式有 premnmx postmnmx tramnmx 標準化處理 將每組資料都為均 值為 0,方 差 為 1 ...
資料歸一化
資料標準化 歸一化 處理是資料探勘的一項基礎工作,不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到資料分析的結果,為了消除指標之間的量綱影響,需要進行資料標準化處理,以解決資料指標之間的可比性。原始資料經過資料標準化處理後,各指標處於同一數量級,適合進行綜合對比評價。以下是兩種常用的歸一...