歸一化方法

2021-09-20 21:51:12 字數 442 閱讀 1582

(1)min-max標準化

(2)z-score標準化方法

定義:也稱為離差標準化,是對原始資料的線性變換,使得結果對映到0-1之間。

本質:把數變為【0,1】之間的小數。

轉換函式:(x-min)/(max-min)

如果想要將資料對映到-1,1,則將公式換成:(x-mean)/(max-min)

其中:max為樣本資料的最大值,min為樣本資料的最小值,mean表示資料的均值。

缺陷:當有新資料加入時,可導致max和min的變化,需要重新定義。

定義:這種方法給與原始資料的均值(mean)和標準差(standard deviation)進行資料的標準化。經過處理的資料符合標準正態分佈,即均值為0,標準差為1.

本質:把有量綱表示式變成無量綱表示式。

轉換函式:(x-mean)/(standard deviation)

資料歸一化方法

本文主要介紹兩種基本的資料歸一化方法。歸一化方法有兩種形式,一種是把數變為 0,1 之間的小數,一種是把有量綱表示式變為無量綱表示式。資料標準化 歸一化 處理是資料探勘的一項基礎工作,不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到資料分析的結果,為了消除指標之間的量綱影響,需要進行資料...

常用歸一化方法

本文 感謝原作者的付出和分享 在機器學習中領域中的資料分析之前,通常需要將資料標準化,利用標準化後得資料進行資料分析。不同評價指標往往具有 不同的量綱和量綱單位,這樣的情況會影響到資料分析的結果,為了消除指標之間的量綱影響,需要進行資料 標準化處 理,以解決資料指標之間的可比性。原始資料經過資料標準...

資料歸一化方法

1 min max標準化 也叫做離差標準化,是一種對原始資料樣本的 線性變換處理,讓樣本從原本的值通過對映轉化為0 1之間的值。norsample sample min max min 其中,min為樣本中的最小值,max為樣本中的最大值。優點是 簡單易行,容易理解實現 缺點是 資料樣本不能頻繁的變...