python進行資料分析(1)
import numpy as np
arr=np.random.randn(4,
4)arr1=np.where(arr>0,
2,1)
arr1.
min(
)arr1.
max(
)arr1.mean(
)arr1.cumsum(0)
arr1.cumsum(1)
arr1.mean(0)
arr1.std(0)
arr1.std(1)
arr1.var(0)
arr1.var(
1)
關於0和1的理解:
其中括號內為0,則縱向軸進行相應均值、求最大、累加等計算;
其中括號內為1,則橫向軸進行相應均值、求最大、累加等計算;
方法說明
sum求和
mean
算術平均數
std標準差
var方差
argmin、argmax
最大、最小元素的索引
cumsum
所有元素的累積和
cumprod
所有元素的累積積
布林值會被強制轉換為1和0
import numpy as np
arr=np.random.randn(
1000
)(arr>0)
.sum()
#正值的數量
另外還有兩個方法any 和all ,對布林型陣列非常有用。any用於測試陣列中是否存在乙個或者多個true,而all則檢查陣列中所有值是否都為true。
bools=np.arr(
[false
,false
,true])
bools.
any(
)bools.
all(
)
這兩種方法能用於非布林型陣列,所有非0元素將會被當作true。
多維陣列可以在任何一軸向上進行排序,只需要將軸編號傳給sort即可:
頂級方法np.sort返回的是陣列的已排序副本,而就地排序則會修改陣列本身。
計算陣列分位數最簡單的辦法是對其進行排序,然後選取特定位置的值:
利用python進行資料分析
目錄 10 minutes to pandas 翻譯 pandas中loc iloc ix的區別 pandas dropna函式 pandas中dataframe的stack unstack 和pivot 方法的對比 pandas中關於set index和reset index的用法 python匿...
利用python進行資料分析
利用python進行資料分析,需要了解一些基本的方法,比如掌握回歸分析的方法,通過線性回歸和邏輯回歸,其實你就可以對大多數的資料進行回歸分析,並得出相對精確地結論。這部分需要掌握的知識點如下 回歸分析 線性回歸 邏輯回歸 基本的分類演算法 決策樹 隨機森林 樸素貝葉斯 基本的聚類演算法 k mean...
《利用Python進行資料分析》筆記
之前的筆記一直記在我的印象筆記上,今天突然想到 不如直接記在部落格上,印象筆記只記錄生活上的事,這樣也分工明確一些。同時也能和大家分享,也許可以幫助到別人。由於這個學習筆記系列主要還是用於個人學習總結用,所以會比較凌亂,望大家理解!2017 9 23 p151 pd.dropna thresh 其中...