大資料分析中許多情況下需要用到矩陣標準化(使該矩陣每一列的平均值為0,標準差為1)
here is the formula:(x-mean())/std()
以上運算是按列進行的,因為通常大資料分析中的矩陣x n*m,其中每一行代表乙個資料,而列代表不同的性質,既是n個資料,每個資料有m種性質
應用:假設現在已經有乙個.npy元資料檔案,我們打算用numpy來將它標準化,於是首先將其load進來,然後分別計算mean和std,如下:
import numpy as np
x = np.load('data.npy')
x-=np.mean(x,axis=0)
x/=np.std(x,axis=0)
有必要解釋一下numpy中的這兩個函式
np.mean(x,axis=0) 表示按列求x的平均值,axis=0表示按列進行
np.std(x,axis=0) 表示按列求x的標準差,axis=0表示按列進行
關於這兩個函式的用法和引數,詳見這裡
於是現在便得到了x的標準化矩陣了
當然我們之後還能將它顯示出來,將矩陣生成圖形之後,plt.show()顯示圖形即可
利用numpy資料分析 酒鬼漫步
在一片空曠的平地上,有乙個酒鬼,他最初停留在原點的位置,這個酒鬼每走一步時,方向是不確定的,在經過時間t之後,我們希望計算出這個酒鬼與原點的距離。這個酒鬼走了2000步 每步0.5公尺 向前走一步記為1,向後走一步記為 1,當計算距原點的距離時,就是將所有的步數進行累計求和。1 使用random模組...
numpy資料分析
2020 11 2 import array arr array.array i list range 10 i表示整型,生成序列後不能改變資料型別 多維陣列ndarray方便處理多維度運算,運算效率高 nparr np.array list range 10 修改值,浮點數取整數段 nparr 2...
資料分析 Numpy
什麼是numpy numpy這個詞 於兩個單詞 numerical和python。numpy是python中的乙個運算速度非常快的乙個數學庫,它非常重視陣列,很多的資料科學的包都是依賴於numpy的。它允許你在python中進行向量和矩陣計算,並且由於許多底層函式實際上是用c編寫的,因此你可以體驗在...