資料歸一化方法

2021-09-10 22:48:42 字數 499 閱讀 8553

1)min-max標準化

也叫做離差標準化,是一種對原始資料樣本的 線性變換處理,讓樣本從原本的值通過對映轉化為0~1之間的值。

norsample=(sample-min)/(max-min)

其中,min為樣本中的最小值,max為樣本中的最大值。

優點是:簡單易行,容易理解實現

缺點是:資料樣本不能頻繁的變更,一旦有新的樣本加入時,max,min需要重新進行定義。

2 )z-score標準化

又稱標準差標準化,處理後的資料符合標準正態分佈。

zsample=(x-mean)/std

其中,mean為樣本均值,std為樣本標準差

z-score最大的優點就是簡單,容易計算,不受資料量級的影響,消除量級給分析帶來的不便。

但估算z-score需要總體的平均值與方差,但是這一值在真實的分析與挖掘中很難得到,大多數情況下是用樣本的均值與標準差替代。z-score的結果只能用於比較資料間的結果,資料的真實意義還需要還原原值。

資料歸一化方法

本文主要介紹兩種基本的資料歸一化方法。歸一化方法有兩種形式,一種是把數變為 0,1 之間的小數,一種是把有量綱表示式變為無量綱表示式。資料標準化 歸一化 處理是資料探勘的一項基礎工作,不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到資料分析的結果,為了消除指標之間的量綱影響,需要進行資料...

資料歸一化的方法

資料特徵之間往往有著不同的分布區間,差異較大的情況下會很大程度的影響資料分析的結果。為了消除這種現象的影響需要對原始資料進行歸一化處理,使得各個指標處於同一數量級。1 max min歸一化 也叫離差標準化,是對原始資料的線性變換,使結果值對映到 0 1 之間。公式為 x x min max min ...

歸一化方法

1 min max標準化 2 z score標準化方法 定義 也稱為離差標準化,是對原始資料的線性變換,使得結果對映到0 1之間。本質 把數變為 0,1 之間的小數。轉換函式 x min max min 如果想要將資料對映到 1,1,則將公式換成 x mean max min 其中 max為樣本資料...