對乙個大檔案中的某列進行分組並對其他列計數和求和
import pandas as pd
import numpy as np
import os
data =pd.read_csv(r'c:\users\lenovo\desktop\12\total.csv').drop_duplicates(['快遞員**'])#去重
data_1 =pd.read_csv(r'c:\users\lenovo\desktop\12\total.csv')
data1 = data.groupby('快遞品牌').aggregate() #分組並分別對其他列做數(去重對快遞員求和)
data1 = pd.concat([data1,data_1.groupby('快遞品牌').aggregate()],axis =1).sort_values(by='投件量')
if os.path.exists(r'c:\users\lenovo\desktop\12\total1.csv'): #判斷檔案是否存在
os.remove(r'c:\users\lenovo\desktop\12\total1.csv') #如果存在檔案則刪除
data1.to_csv(r'c:\users\lenovo\desktop\12\total1.csv')
分組統計資料
with a as select convert varchar 10 starttime,120 starttime,case when organid like 0226 then else 非 end as deptname,sum case when billableseconds 0 th...
python分組統計資料 資料分組統計
統計分析資料的時候,經常需要進行分組統計。分組操作在python裡的實現方式就是groupby語句。慣例,咱們先造乙個dataframe表。import pandas as pd dic 結果為 math physics science class a 77.0 176 88 b 38.5 100 ...
常用日期分組統計資料
在日常統計資料中 經常有用到按照日期或者周或者月或者年來作為統計分組 主要用的函式date format 常用如 1 select date format create time,y u weeks,count caseid count from tc case group by weeks 2 s...