關於pandas groupby 的幾點深入研究

2021-10-05 22:18:49 字數 1595 閱讀 3189

在乙個groupby 語句中實現多列計算

dfgp=dfal.groupby(

['機構**'

,'機構'

]) \

.agg(

人力=('姓名'

,'size'),

//計數

預簽人力=

('是否預簽'

,'sum'),

//求和

預簽率=

('是否預簽'

,lambda x:

sum(x)

/len

(x)*

100)

,//本列未0

,1,求和作為分子,計數作為分母

保費預估低檔=

('保費預估低檔'

,lambda x:

(x.sum()

/10000).

round(2

)),//彙總後以萬為單位四捨五入

保費預估中檔=

('保費預估中檔'

,lambda x:

(x.sum()

/10000).

round(2

)), 保費預估高檔=

('保費預估高檔'

,lambda x:

(x.sum()

/10000).

round(2

))).reset_index(

)//重置索引,否則分組欄位將被預設為索引

dfgpcnt= dfrlgpall.groupby(

['organ_id'

,"機構"

]) \

.agg(

總監=('grade_type4'

,lambda x:

( x==

'總監').

sum())

,

高經=('grade_type4'

,lambda x:

( x==

'高經').

sum())

, 業經=

('grade_type4'

,lambda x:

( x==

'業經').

sum())

, 業務員=

('grade_type4'

,lambda x:

( x==

'業務員').

sum())

).reset_index(

)dfgpcnt=dfrlgpall.groupby(

['organ_id'

,"機構"

],as_index=

false

) \ .

(lambda x: pd.series())

df04=df03.groupby(

['分公司'

,'中支名稱'

,'四級機構名稱'

,'業務員姓名'

,'業務員**'

]) \

.(lambda x:pd.series())

.reset_index(

)

Pandas groupby 自定義聚合函式

自定義聚合函式,n.i.o 出現次數0 0 n.i.o 出現次數1 進一步判斷 n.i.o 出現次數大於2 2 此函式需進一步擴充套件,出現次數大於2的,需要根據計畫頻率,判斷是否在一次連續測試內 defpeak peak arr,df 判斷arr的series值中是否包含 n.i.o x list...

關於程式關於世界

首先,在學了1年多的軟體設計的基礎上,問下自己 程式是什麼?業務需求是什麼?程式有什麼用?什麼是演算法?什麼是資料庫?或許每個人的理解不同,會給出不同的答案。那麼自己的理解 程式是乙個讓計算機工作的流程,在程式寫好之後,計算機就會按照,程式設計師定義好流程在執行。其實很多時候,乙個程式的好壞,在於乙...

關於血液關於軟體

1 自然沉降法 將血袋垂直吊掛於4 2 冰箱內,使紅細胞自然下沉1 3d,或將血袋呈70 80 角立於冰箱,需用時,用一次性分漿器分出血漿,制得濃縮紅細胞。2 洗滌法 一般用生理鹽水反覆洗滌3 6次。經洗滌的紅細胞,除白細胞和血小板減少外,血漿蛋白也極少,紅細胞中殘存的血漿蛋白含量約為原總蛋白的1 ...