# 選擇col列的值大於0.5的行
df[df[col]
>
0.5]:
# 按照列col1排序資料,預設公升序排列
df.sort_values(col1):
# 按照列col1降序排列資料
df.sort_values(col2, ascending=
false
):# 先按列col1公升序排列,後按col2降序排列資料
df.sort_values(
[col1,col2]
, ascending=
[true
,false]):
# 返回乙個按列col進行分組的groupby物件
df.groupby(col):
# 返回乙個按多列進行分組的groupby物件
df.groupby(
[col1,col2]
):# 返回按列col1進行分組後,列col2的均值
df.groupby(col1)
[col2]:
# 建立乙個按列col1進行分組,並計算col2和col3的最大值的資料透視表
df.pivot_table(index=col1, values=
[col2,col3]
, aggfunc=
max):
# 返回按列col1分組的所有列的均值
df.groupby(col1)
.agg(np.mean):
# 對dataframe中的每一列應用函式np.mean
data.
(np.mean):
# 對dataframe中的每一行應用函式np.max
data.
(np.
max,axis=
1):
Pandas中資料的缺失處理
在pandas資料處理中,資料值缺失是經常面臨的問題。如何查詢 處理缺失值就成了資料處理的必備方法。一 缺失值型別 pandas中缺失值主要有三種符號 np.nan none和nat。np.nan是缺失值的一種符號,nan意為not a number。它不等於任何東西,包括它本身。其次,在使用equ...
pandas處理資料
pd.read csv path to file.txt header 0,names ab index 0 names columns這個可以不寫,制定索引列是第一列,這樣就沒有序號 np.tofile d python np.txt 類似於二維列表 充分利用map函式 df.a df.a.map...
pandas 資料處理
pandas中資料可以分為series,dataframe,panel分別表示一維至三維資料。其中在構造時,index表示行名,columns表示列名 構造方式 s pd.series data index index s pd series np random randn 5 index a b ...