風火程式設計 機器學習之標準化和歸一化

2021-09-13 12:37:00 字數 865 閱讀 1347

描述

把資料縮放到指定的範圍之內.

介面

from sklearn.preprocessing.scale

x = scale(x)

# 分別處理xtrain和x_test

from sklearn.preprocessing import minmaxscaler

ss = minmaxscaler((0, 1))

ss.fit(x_train)

x_train = ss.transform(x_train)

描述

去除因子數量級差異造成的權重不均衡對結果的影響.在誰用梯度下降回歸時,必須進行歸一化處理.

極值歸一化適用於有明顯邊界的資料,均值方差歸一化適用於沒有明顯邊界的資料,使均值接近0,方差接近1

對於沒有明顯邊界的資料用極值歸一化會受離群值的影響,可以先去極值.

介面

from sklearn.preprocessing import standardscaler

ss = standardscaler()

ss.fit(x_train)

x_train = ss.transform(x_train)

# 檢視均值

ss.mean_

# 檢視標準差

ss.scale_

x_test = ss.transform(x_test)

# 資料探索

data.describe()

print(df.head(5))

機器學習的歸一化和標準化

一般做機器學習應用的時候大部分時間是花費在特徵處理上,其中很關鍵的一步就是對特徵資料進行歸一化,為什麼要歸一化呢?很多同學並未搞清楚,維基百科給出的解釋 1 歸一化後加快了梯度下降求最優解的速度,主要是加快梯度下降法收斂速度。2 歸一化有可能提高精度。下面我簡單擴充套件解釋下這兩點。有兩種實現方法 ...

標準化與歸一化 機器學習

歸一化和標準化經常被搞混,程度還比較嚴重,非常干擾大家的理解。為了方便後續的討論,必須先明確二者的定義。如果要把輸入資料轉換到 0,1 的範圍,可以用如下公式進行計算 按以上方式進行歸一化以後,輸入資料轉換到 0,1 的範圍。有時候我們希望將輸入轉換到 1,1 的範圍,可以使用以下的公式 以上兩種方...

機器學習中的標準化和歸一化

這個真的是讓人困惑,分別解釋一下,首先說一下方差和均值 e x d x begin mu e x sigma sqrt end e x d x 1.歸一化 為什麼叫歸一化,歸一化顧名思義就是將資料轉換到0 1之間 x x xm inxm ax x min xxma x xm in x minx ma...