pandas中資料的處理

2021-10-02 06:53:20 字數 914 閱讀 5633

# 選擇col列的值大於0.5的行

df[df[col]

>

0.5]:

# 按照列col1排序資料,預設公升序排列

df.sort_values(col1):

# 按照列col1降序排列資料

df.sort_values(col2, ascending=

false

):# 先按列col1公升序排列,後按col2降序排列資料

df.sort_values(

[col1,col2]

, ascending=

[true

,false]):

# 返回乙個按列col進行分組的groupby物件

df.groupby(col):

# 返回乙個按多列進行分組的groupby物件

df.groupby(

[col1,col2]

):# 返回按列col1進行分組後,列col2的均值

df.groupby(col1)

[col2]:

# 建立乙個按列col1進行分組,並計算col2和col3的最大值的資料透視表

df.pivot_table(index=col1, values=

[col2,col3]

, aggfunc=

max):

# 返回按列col1分組的所有列的均值

df.groupby(col1)

.agg(np.mean):

# 對dataframe中的每一列應用函式np.mean

data.

(np.mean):

# 對dataframe中的每一行應用函式np.max

data.

(np.

max,axis=

1):

Pandas中資料的缺失處理

在pandas資料處理中,資料值缺失是經常面臨的問題。如何查詢 處理缺失值就成了資料處理的必備方法。一 缺失值型別 pandas中缺失值主要有三種符號 np.nan none和nat。np.nan是缺失值的一種符號,nan意為not a number。它不等於任何東西,包括它本身。其次,在使用equ...

pandas處理資料

pd.read csv path to file.txt header 0,names ab index 0 names columns這個可以不寫,制定索引列是第一列,這樣就沒有序號 np.tofile d python np.txt 類似於二維列表 充分利用map函式 df.a df.a.map...

pandas 資料處理

pandas中資料可以分為series,dataframe,panel分別表示一維至三維資料。其中在構造時,index表示行名,columns表示列名 構造方式 s pd.series data index index s pd series np random randn 5 index a b ...