為什麼要進行歸一化處理,下面從尋找最優解這個角度給出自己的看法。
例子假定為**房價的例子,自變數為面積,房間數兩個,因變數為房價。
那麼可以得到的公式為:
[公式]
其中[公式]代表房間數,[公式]代表[公式]變數前面的係數。
其中[公式]代表面積,[公式]代表[公式]變數前面的係數。
首先我們祭出兩張圖代表資料是否均一化的最優解尋解過程。
未歸一化:
我們在尋找最優解的過程也就是在使得損失函式值最小的theta1,theta2。
上述兩幅圖**的是損失函式的等高線。
我們很容易看出,當資料沒有歸一化的時候,面積數的範圍可以從01000,房間數的範圍一般為010,可以看出面積數的取值範圍遠大於房間數。
影響這樣造成的影響就是在畫損失函式的時候,
資料沒有歸一化的表示式,可以為:
[公式]
造成影象的等高線為類似橢圓形狀,最優解的尋優過程就是像下圖所示:
[公式]
其中變數的前面係數幾乎一樣,則影象的等高線為類似圓形形狀,最優解的尋優過程像下圖所示:
這也是資料為什麼要歸一化的乙個原因。
在這裡向憶貞表示抱歉,剽竊了你的成果,我這裡主要是想做個記錄以及想要將要的東西分享給大家,一鞠躬,二鞠躬,三鞠躬。
歸一化的本質原因
資料歸一化 或者標準化,注意歸一化和標準化不同 的原因 要強調 能不歸一化最好不歸一化,之所以進行資料歸一化是因為各維度的量綱不相同。而且需要看情況進行歸一化。有些模型在各維度進行了不均勻的伸縮後,最優解與原來不等價 如svm 需要歸一化。有些模型伸縮有與原來等價,如 lr則不用歸一化,但是實際中往...
歸一化強度代表什麼 為什麼對資料進行歸一化處理
在機器學習中,經常需要對資料進行歸一化處理。那麼,為什麼需要進行歸一化處理呢,本文從尋找最優解這個角度解析。例子假定為 房價的例子,自變數為面積,房間數兩個,因變數為房價。那麼可以得到的公式為 其中代表房間數,代表變數 前面的係數。其中代表面積,代表變數 前面的係數。首先,我們用兩張圖代表資料是否均...
利用Python進行資料歸一化
歸一化化定義 歸一化就是要把需要處理的資料經過處理後 通過某種演算法 限制在你需要的一定範圍內。歸一化方法有兩種形式 一種是把數變為 0,1 之間的小數 一種是把有量綱表示式變為無量綱表示式 class sklearn.preprocessing.minmaxscaler feature range...