sklearn資料標準化

2021-07-28 19:16:17 字數 1686 閱讀 9819

#encoding:utf-8

'''''

created on 2023年10月13日

@author: zhoumeixu204

'''#sklearn資料標準化,資料標準化有三種

#第一種是z-score,或者去除均值和方差縮放

from

sklearn 

import

preprocessing  

import

numpy as np  

x=np.array([[1.

,-1.,2.

],  

[2.,0.,

0.],  

[0.,

1.,-

1.]])  

x_scaled=preprocessing.scale(x)  

x_scaled.mean(axis=0

)  x_scaled.std(axis=0

)  # 使用sklearn.preprocessing.standardscaler類,

# 使用該類的好處在於可以儲存訓練集中的引數(均值、方差)

# 直接使用其物件轉換測試集資料。

scaler=preprocessing.standardscaler().fit(x)  

scaler.mean_  

scaler.std_  

scaler.transform(x)  #跟上面的結果是一樣的

#第二種是將屬性縮放到乙個指定範圍,也是就是(x-min)/(max-min)

#依賴於preprocessing中的minmaxscaler類

x_train=np.array([[1.

,-1.,2.

],  

[2.,0.,

0.],  

[0.,

1.,-

1.]])  

min_max_scaler=preprocessing.minmaxscaler()  

x_train_minmax=min_max_scaler.fit_transform(x_train)  

print

(x_train_minmax)  

# 當然,在構造類物件的時候也可以直接指定最大最小值的範圍:feature_range=(min, max),此時應用的公式變為:

# x_std=(x-x.min(axis=0))/(x.max(axis=0)-x.min(axis=0))

# x_scaled=x_std/(max-min)+min

#第三種是正則化normalization

x=np.array([[1.

,-1.,2.

],  

[2.,0.,

0.],  

[0.,

1.,-

1.]])  

x_normalized=preprocessing.normalize(x,norm='l2'

)  print

(x_normalized)  

# 可以使用processing.normalizer()類實現對訓練集和測試集的擬合和轉換

normalizer=preprocessing.normalizer().fit(x)  

print

(normalizer)  

normalizer.transform(x)  

sklearn資料標準化

解釋1 解釋2sklearn資料標準化 from sklearn import preprocessing import numpy as np資料標準化常見方法 離差標準化 結果對映到 0,1 區間 sklearn實現方法 採用minmaxscaler或者maxabsscaler,使用方法與sta...

sklearn 資料標準化

資料集標準化 函式 sklearn.preprocessing.scale x,axis 0,with mean true,with std true,copy true 引數解釋 x 要標準化的資料,numpy的array類資料。axis int 0 by default 0表示特徵的標準化,1表...

使用sklearn對資料進行標準化 正則化

也叫離差標準化,是對原始資料的線性變換,使結果落到 0,1 區間,轉換函式如下 x x mi nmax min x frac x max min x mi n 其中max為樣本資料的最大值,min為樣本資料的最小值。這種方法有乙個缺陷就是當有新資料加入時,可能導致max和min的變化,需要重新定義。...