z-score標準化
1.產生隨機數
importnumpy as np
## 產生隨機數
data_1 = np.random.randn(3, 4) #
從標準正態分佈中返回乙個或多個樣本值.
data_2 = np.random.rand(3, 4) #
產生(0,1)的數
print('
randn產生的隨機數:\n
', data_1)
print('
rand產生的隨機數:\n
', data_2)
shape =data_1.shape
print('
data_1的維數:\n
', shape)
2.使用sklearn包
from sklearn.preprocessing importstandardscaler
## 標準化(使特徵資料方差為1,均值為0)
#使用sklearn的包
scaler =standardscaler()
scaler.fit(data_2)
#使用transfrom必須要用fit語句
trans_data_2 = scaler.transform(data_2) #
transfrom通過找中心和縮放等實現標準化
fit_trans_data_2 = scaler.fit_transform(data_2) #
fit_transfrom為先擬合資料,然後轉化它將其轉化為標準形式
print('
使用fit,transform標準化的資料:\n
', trans_data_2)
print('
使用fit_transform標準化的資料:\n
', fit_trans_data_2)
3.使用numpy進行處理
importnumpy as np
#使用numpy的語句
sum_total = data_2.sum() #
整個矩陣求和
sum_row = data_2.sum(axis=1) #
行求和sum_col = data_2.sum(axis=0) #
列求和mean = np.mean(data_2, axis=0) #
求平均值
std = np.std(data_2, axis=0) #
標準差var = std**2
print('
data_2求和為:\n
', sum_col/3)
print('
平均值為:\n
', mean)
print('
方差為:\n
', var)
numpy_trans_data_2 = (data_2 - mean)/std
print('
使用numpy進行標準化:\n
', numpy_trans_data_2)
注意:z-score標準化是要除以std(標準差),恰好對應於standardscaler()
min-max標準化僅僅將standardscaler()換為minmaxscaler()即可
python 資料標準化
def datastandard from sklearn import preprocessing import numpy as np x np.array 1.1.2.2.0.0.0.1.1.print 原始資料為 n x print method1 指定均值方差資料標準化 預設均值0 方差 ...
Python 資料標準化
定義 將資料按照一定的比例進行縮放,使其落入乙個特定的區間。好處 加快模型的收斂速度,提高模型 精度 常見的六種標準化方法 class datanorm def init self self.arr 1 2,3 4,5 6,7 8,9 self.x max max self.arr self.x m...
python中資料標準化
公式為 x mean std 計算時對每個屬性 每列分別進行。將資料按期屬性 按列進行 減去其均值,並處以其方差。得到的結果是 對於每個屬行 每列來說所有資料都聚集在0附近,方差為1。實現時,有兩種不同的方式 1 sklearn.preprocessing.scale 函式,可以直接將給定資料進行標...