python進行資料分析

2021-10-20 08:25:22 字數 1402 閱讀 3165

python進行資料分析(1)

import numpy as np 

arr=np.random.randn(4,

4)arr1=np.where(arr>0,

2,1)

arr1.

min(

)arr1.

max(

)arr1.mean(

)arr1.cumsum(0)

arr1.cumsum(1)

arr1.mean(0)

arr1.std(0)

arr1.std(1)

arr1.var(0)

arr1.var(

1)

關於0和1的理解:

其中括號內為0,則縱向軸進行相應均值、求最大、累加等計算;

其中括號內為1,則橫向軸進行相應均值、求最大、累加等計算;

方法說明

sum求和

mean

算術平均數

std標準差

var方差

argmin、argmax

最大、最小元素的索引

cumsum

所有元素的累積和

cumprod

所有元素的累積積

布林值會被強制轉換為1和0

import numpy as np 

arr=np.random.randn(

1000

)(arr>0)

.sum()

#正值的數量

另外還有兩個方法any 和all ,對布林型陣列非常有用。any用於測試陣列中是否存在乙個或者多個true,而all則檢查陣列中所有值是否都為true。

bools=np.arr(

[false

,false

,true])

bools.

any(

)bools.

all(

)

這兩種方法能用於非布林型陣列,所有非0元素將會被當作true。

多維陣列可以在任何一軸向上進行排序,只需要將軸編號傳給sort即可:

頂級方法np.sort返回的是陣列的已排序副本,而就地排序則會修改陣列本身。

計算陣列分位數最簡單的辦法是對其進行排序,然後選取特定位置的值:

利用python進行資料分析

目錄 10 minutes to pandas 翻譯 pandas中loc iloc ix的區別 pandas dropna函式 pandas中dataframe的stack unstack 和pivot 方法的對比 pandas中關於set index和reset index的用法 python匿...

利用python進行資料分析

利用python進行資料分析,需要了解一些基本的方法,比如掌握回歸分析的方法,通過線性回歸和邏輯回歸,其實你就可以對大多數的資料進行回歸分析,並得出相對精確地結論。這部分需要掌握的知識點如下 回歸分析 線性回歸 邏輯回歸 基本的分類演算法 決策樹 隨機森林 樸素貝葉斯 基本的聚類演算法 k mean...

《利用Python進行資料分析》筆記

之前的筆記一直記在我的印象筆記上,今天突然想到 不如直接記在部落格上,印象筆記只記錄生活上的事,這樣也分工明確一些。同時也能和大家分享,也許可以幫助到別人。由於這個學習筆記系列主要還是用於個人學習總結用,所以會比較凌亂,望大家理解!2017 9 23 p151 pd.dropna thresh 其中...