分組計算三部曲:拆分-->應用-->合併
分組:就是按照行或列把相同索引的部分分到一起
1import
pandas as pd
2import
numpy as np34
#先建立乙個dataframe
5 df =pd.dataframe()
1112 df['
data1
'].groupby(df['
key1
']).mean()13#
對data1列採用key1列分組並求平均值,所謂分組,就是把相同的行或列分到一起14#
然後就可以分別對這些分好的組進行一系列操作
1516 key = [1,2,1,1,2] #
也可以給出任意索引鍵,自定義分組
17 df['
data1
'].groupby(key).mean() #
這時就會把相同索引的值分到一起
1819 df['
data1
'].groupby([df['
key1
'],df['
key2
']]).size()
20 mean = df.groupby(['
key1
','key2
']).sum()['
data1']
21#也可進行再分組,可以先把key1先分組,在此基礎上再以key2索引進行分組22#
輸出的mean
23key1 key2
24 a one 11
25 two 4
26 b one 1
27 two 9
28name: data1, dtype: int32
2930 mean.unstack() #
這個方式可以轉換為dataframe
313233#
通過分組key1,將其創鍵為字典,可以很清晰看出分組的實際意義
34 dict(list(df.groupby('
key1
')))35#
輸出36
4243
#以上是進行行分組,也可以進行列分組
44 df.groupby(df.dtypes, axis=1).sum() #
axis=1表示按列分組
4546 df.dtypes #
區分的是每列的資料型別47#
它的輸出結果
48key1 object
49key2 object
50data1 int32
51data2 int32
52 dtype: object
python資料處理包pandas之分組聚合
2.資料聚合 3.分組運算和轉換 分組計算三步曲 拆分 應用 合併拆分 df pd.dataframe 1.1 對series進行分組grouped df data1 groupby df key1 多級分組 df data1 groupby df key1 df key2 mean 1.2 對da...
pandas分組計算平均值 Pandas之分組計算
技術總編 張學人 好訊息!爬蟲俱樂部將於2019年5月2日至4日在武漢舉行stata程式設計技術五一訓練營,此次採用理論與案例相結合的方式,旨在幫助大家熟悉stata資料分析技巧,能夠通過程式設計讀取不同型別的資料來源 實現複雜資料合併 清洗的程式化,並且熟悉stata核心的爬蟲技術。我們以auto...
pandas基礎分組
outputs source import numpy as np n import pandas as pd source 分組 group source 生成資料 outputs execution count 22 metadata output type execute result sou...