(1)min-max標準化
(2)z-score標準化方法
定義:也稱為離差標準化,是對原始資料的線性變換,使得結果對映到0-1之間。
本質:把數變為【0,1】之間的小數。
轉換函式:(x-min)/(max-min)
如果想要將資料對映到-1,1,則將公式換成:(x-mean)/(max-min)
其中:max為樣本資料的最大值,min為樣本資料的最小值,mean表示資料的均值。
缺陷:當有新資料加入時,可導致max和min的變化,需要重新定義。
定義:這種方法給與原始資料的均值(mean)和標準差(standard deviation)進行資料的標準化。經過處理的資料符合標準正態分佈,即均值為0,標準差為1.
本質:把有量綱表示式變成無量綱表示式。
轉換函式:(x-mean)/(standard deviation)
資料歸一化方法
本文主要介紹兩種基本的資料歸一化方法。歸一化方法有兩種形式,一種是把數變為 0,1 之間的小數,一種是把有量綱表示式變為無量綱表示式。資料標準化 歸一化 處理是資料探勘的一項基礎工作,不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到資料分析的結果,為了消除指標之間的量綱影響,需要進行資料...
常用歸一化方法
本文 感謝原作者的付出和分享 在機器學習中領域中的資料分析之前,通常需要將資料標準化,利用標準化後得資料進行資料分析。不同評價指標往往具有 不同的量綱和量綱單位,這樣的情況會影響到資料分析的結果,為了消除指標之間的量綱影響,需要進行資料 標準化處 理,以解決資料指標之間的可比性。原始資料經過資料標準...
資料歸一化方法
1 min max標準化 也叫做離差標準化,是一種對原始資料樣本的 線性變換處理,讓樣本從原本的值通過對映轉化為0 1之間的值。norsample sample min max min 其中,min為樣本中的最小值,max為樣本中的最大值。優點是 簡單易行,容易理解實現 缺點是 資料樣本不能頻繁的變...