資料的歸一化

2021-08-09 18:13:42 字數 657 閱讀 6146

正常情況下,資料的處理用的都是線性歸一化,但是如果實驗的資料服從某種分布函式時,其中最多的就是正態分佈了,假設實驗資料是服從正態分佈的,我們可以通過乙個函式來對資料進行變換,這個函式選取的原則就是使得原有資料中的資訊量最多,即資訊熵最大。首先我說一下資訊熵的計算方法:

可能這裡講熵的概念更難理解了,換句話說吧,你覺得所有分布函式中什麼分布函式能讓上述式子中l達到最大值,均勻分布是不是??這也是線性歸一化最後資料服從均勻分布的原因。

綜上所述,就是說我們需要將原有的資料x通過乙個函式h轉換為乙個均勻分布的資料h(x),這樣可以使得資料的資訊量最大,這個函式怎麼找到呢??我記得我曾經在求正態分佈的隨機數的時候證明過乙個服從任何分布的隨機數(其分布函式一定是乙個均勻分布的函式,所以隨機數的分布函式是乙個很好的選擇。

對於乙個服從正態分佈的隨機數而言,其分布函式就是s函式。

所以在對資料進行歸一化的時候s函式對資料進行歸一化的方法用的很廣泛,這是因為自然界中服從正態分佈的隨機數多而已,不是其本身的特性所決定。

資料歸一化

近來,在網上搜了很多關於資料歸一化的帖子,看了太多,很雜,這裡整理總結一下 歸一化是一種資料預處理方法,就是要把你需要處理的資料經過處理後 通過某種演算法 限制在你需要的一定範圍內,為了後面資料處理的方便,其次是保正程式執行時 收斂加快。比如說,對於奇異樣本資料 所謂奇異樣本資料資料指的是相對於其他...

資料歸一化

如果對神經網路的 輸入和 輸出數 據進行 一定的 預處理 可以加快網路的訓練速 度 matlab 中 提供的預 處理方 法有歸一化處理 將每組資料都變為 1 至 1 之 間數 所涉及 的函式有 premnmx postmnmx tramnmx 標準化處理 將每組資料都為均 值為 0,方 差 為 1 ...

資料歸一化

資料標準化 歸一化 處理是資料探勘的一項基礎工作,不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到資料分析的結果,為了消除指標之間的量綱影響,需要進行資料標準化處理,以解決資料指標之間的可比性。原始資料經過資料標準化處理後,各指標處於同一數量級,適合進行綜合對比評價。以下是兩種常用的歸一...