分組運算,先根據一定規則拆分後的資料,然後對資料進行聚合運算,如前面見到的 mean(), sum() 等就是聚合的例子。聚合時,拆分後的第乙個索引指定的資料都會依次傳給聚合函式進行運算。最後再把運算結果合併起來,生成最終結果。
先生成乙個dataframe
)#用key1的索引分類再求平均
df.groupby(
'key1').
sum(
)#用key1的索引分類再求和
df.groupby(
'key1').
min(
)#用key1的索引分類再求最小值
df.groupby(
'key1').
max(
)#用key1的索引分類再求最大值
df.groupby(
'key1'
).describe(
)#用key1的索引分類,對每個分組運用一系列的內建函式
func的引數為groupby索引對應的記錄
grouped=df.groupby(
'key1'
)def
peak_range
(s):
print
(type
(s))
##引數為索引所對應的記錄
# 同時應用多個聚合函式
grouped.agg(
['mean'
,'std'
,'sum'
, peak_range]
)# 針對data求4個聚合資料平均值,標準差,和,波動幅度
)#根據key1分組求平均值,順麵改一下列名稱前面加mean_
)#把錶2拼接到表1右邊
)#transform函式沒看懂,一會再搜一下把
k1_mean
df[k1_mean.columns]
= k1_mean#給原來的k1新加兩個列,也是合併
df
pandas分組運算(groupby)
按a列分組 groupby 獲取其他列的均值 方法1 b df b groupby df a mean 按a列分組,獲取b列的均值 print b 方法2 b df.ix 1 groupby df.ix 0 mean 按a列分組 0對應a列,1對應b列 獲取b列的均值 print b 方法3 2.聚...
pandas數學聚合和分組運算的簡單基礎
什麼都不多說,注釋裡有解釋 from pandas import series,dataframe import numpy as np import os df dataframe print df 將 b 這一列拿出來,按 b 進行分組等操作 group df.groupby b print g...
pandas 分組聚合
綜合使用 資料鏈結 統計每個國家的星巴克的數量 按照單字段聚合 codeing utf 8 import pandas as pd import numpy as np df pd.read csv data starbucks store worldwide.csv 按國家進行分組後會有很多列 然...