資料歸一化操作

2021-10-06 03:55:30 字數 899 閱讀 3889

記錄一下資料歸一化的方法。有的資料集特徵間的值差距太大,會影響深度學習的效果,實現資料的歸一化,能夠有效消除這個影響,**展示的是將資料歸一化[0,1]中。

import numpy as np

dataset=[[

1,2,

3],[

0,3,

4],[

0,5,

6],[

0,1,

1],[

1,3000000,1

],[1

,90001,1

]]#6行3列的矩陣,最後一列是標籤

data = np.delete(dataset,-1

, axis=1)

print

(data)

labels=np.array(dataset,dtype=np.int32)[:

,-1]

mmax = np.

max(data, axis=0)

#每個特徵的最大值

mmin = np.

min(data, axis=0)

#每個特徵最小值

for i in

range

(len

(mmax)):

if mmax[i]

== mmin[i]

:#如果最大值等於最小值

mmax[i]

+=0.000001

res =

(data - mmin)

/(mmax - mmin)

#這個是歸一化核心公式

res = np.c_[res,labels]

#輸出的是歸一化後的資料和標籤

print

(res)

資料歸一化

近來,在網上搜了很多關於資料歸一化的帖子,看了太多,很雜,這裡整理總結一下 歸一化是一種資料預處理方法,就是要把你需要處理的資料經過處理後 通過某種演算法 限制在你需要的一定範圍內,為了後面資料處理的方便,其次是保正程式執行時 收斂加快。比如說,對於奇異樣本資料 所謂奇異樣本資料資料指的是相對於其他...

資料歸一化

如果對神經網路的 輸入和 輸出數 據進行 一定的 預處理 可以加快網路的訓練速 度 matlab 中 提供的預 處理方 法有歸一化處理 將每組資料都變為 1 至 1 之 間數 所涉及 的函式有 premnmx postmnmx tramnmx 標準化處理 將每組資料都為均 值為 0,方 差 為 1 ...

資料歸一化

資料標準化 歸一化 處理是資料探勘的一項基礎工作,不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到資料分析的結果,為了消除指標之間的量綱影響,需要進行資料標準化處理,以解決資料指標之間的可比性。原始資料經過資料標準化處理後,各指標處於同一數量級,適合進行綜合對比評價。以下是兩種常用的歸一...