python中資料標準化

2021-08-14 17:06:59 字數 1084 閱讀 7710

公式為:(x-mean)/std  計算時對每個屬性/每列分別進行。將資料按期屬性(按列進行)減去其均值,並處以其方差。得到的結果是 ,對於每個屬行/每列來說所有資料都聚集在0附近,方差為1。

實現時,有兩種不同的方式:

1、sklearn.preprocessing.scale()函式,可以直接將給定資料進行標準化。

2、使用sklearn.preprocessing.standardscaler類,使用該類的好處在於可以儲存訓練集中的引數(均值、方差)直接使用其物件轉換測試集資料。

python 資料標準化

def datastandard from sklearn import preprocessing import numpy as np x np.array 1.1.2.2.0.0.0.1.1.print 原始資料為 n x print method1 指定均值方差資料標準化 預設均值0 方差 ...

Python 資料標準化

定義 將資料按照一定的比例進行縮放,使其落入乙個特定的區間。好處 加快模型的收斂速度,提高模型 精度 常見的六種標準化方法 class datanorm def init self self.arr 1 2,3 4,5 6,7 8,9 self.x max max self.arr self.x m...

Python資料標準化

z score標準化 1.產生隨機數 import numpy as np 產生隨機數 data 1 np.random.randn 3,4 從標準正態分佈中返回乙個或多個樣本值.data 2 np.random.rand 3,4 產生 0,1 的數 print randn產生的隨機數 n data...