#encoding:utf-8
'''''
created on 2023年10月13日
@author: zhoumeixu204
'''#sklearn資料標準化,資料標準化有三種
#第一種是z-score,或者去除均值和方差縮放
from
sklearn
import
preprocessing
import
numpy as np
x=np.array([[1.
,-1.,2.
],
[2.,0.,
0.],
[0.,
1.,-
1.]])
x_scaled=preprocessing.scale(x)
x_scaled.mean(axis=0
) x_scaled.std(axis=0
) # 使用sklearn.preprocessing.standardscaler類,
# 使用該類的好處在於可以儲存訓練集中的引數(均值、方差)
# 直接使用其物件轉換測試集資料。
scaler=preprocessing.standardscaler().fit(x)
scaler.mean_
scaler.std_
scaler.transform(x) #跟上面的結果是一樣的
#第二種是將屬性縮放到乙個指定範圍,也是就是(x-min)/(max-min)
#依賴於preprocessing中的minmaxscaler類
x_train=np.array([[1.
,-1.,2.
],
[2.,0.,
0.],
[0.,
1.,-
1.]])
min_max_scaler=preprocessing.minmaxscaler()
x_train_minmax=min_max_scaler.fit_transform(x_train)
(x_train_minmax)
# 當然,在構造類物件的時候也可以直接指定最大最小值的範圍:feature_range=(min, max),此時應用的公式變為:
# x_std=(x-x.min(axis=0))/(x.max(axis=0)-x.min(axis=0))
# x_scaled=x_std/(max-min)+min
#第三種是正則化normalization
x=np.array([[1.
,-1.,2.
],
[2.,0.,
0.],
[0.,
1.,-
1.]])
x_normalized=preprocessing.normalize(x,norm='l2'
(x_normalized)
# 可以使用processing.normalizer()類實現對訓練集和測試集的擬合和轉換
normalizer=preprocessing.normalizer().fit(x)
(normalizer)
normalizer.transform(x)
sklearn資料標準化
解釋1 解釋2sklearn資料標準化 from sklearn import preprocessing import numpy as np資料標準化常見方法 離差標準化 結果對映到 0,1 區間 sklearn實現方法 採用minmaxscaler或者maxabsscaler,使用方法與sta...
sklearn 資料標準化
資料集標準化 函式 sklearn.preprocessing.scale x,axis 0,with mean true,with std true,copy true 引數解釋 x 要標準化的資料,numpy的array類資料。axis int 0 by default 0表示特徵的標準化,1表...
使用sklearn對資料進行標準化 正則化
也叫離差標準化,是對原始資料的線性變換,使結果落到 0,1 區間,轉換函式如下 x x mi nmax min x frac x max min x mi n 其中max為樣本資料的最大值,min為樣本資料的最小值。這種方法有乙個缺陷就是當有新資料加入時,可能導致max和min的變化,需要重新定義。...