一、分組
1、語法
grouped= df.groupby(by='columns name')
#grouped是乙個dataframegroupby物件,是可迭代的(遍歷)
#grouped中的每乙個元素都是乙個元祖
#元祖: (索引(分組的值), 分組之後的dataframe)
2、取值
grouped.count() #獲取分組中非nan的數量
grouped.count()[['
m']] #
獲取m列索引的值, 注意 [['m']] 結果的type是dataframe
grouped.count()['
m'] #
獲取m列索引的值, 注意 ['m'] 結果的type是series
3、多個分組
#多個分組
grouped= df.groupby(by=['
columns_name1
', '
columns_name2'])
#獲取分組後的某一部分資料
grouped = df1.groupby(by=['
o', 'n'
])grouped.count()['m
']或grouped['m
'].count()
#對某幾列資料進行分組
grouped = df1['
m'].groupby(by=[df1['
o'], df1['
n']]) #
series#或
grouped = df1[['
m']].groupby(by=[df1['
o'], df1['
n']]) #
dataframe
grouped.count()
二、聚合
dataframegroupby物件的聚合方法
函式名 說明count 分組中非na的數量
sum 非na值的和
mean 非na值的平均值
median 非na值的中位數
std、var 標準差、方差
min、max 非na值中的最小值、最大值
pandas 分組聚合
綜合使用 資料鏈結 統計每個國家的星巴克的數量 按照單字段聚合 codeing utf 8 import pandas as pd import numpy as np df pd.read csv data starbucks store worldwide.csv 按國家進行分組後會有很多列 然...
pandas資料分組和聚合操作
python for data analysis dataframe可以在其行 axis 0 或列 axis 1 上進行分組。然後,將乙個函式應用到各個分組並產生新值。最後,所有這些函式的執行結果會被合併到最終的結果物件中去。groupby的size方法可以返回乙個含有分組大小的series。for...
七 資料聚合和分組運算
1.df data1 groupby df key1 呼叫 等價於對部分列進行索引 df.groupby df key1 data1 2.分組 groupby 1 選取乙個或一組列 data.groupby data ss ss1 2 通過函式進行分組 dataframe.groupby len 3...