Pandas 實現分組計數且不計重複

在對dataframe進行分析的時候會遇到需要分組計數，計數的column中屬性有重複，但又需要僅對不重複的項計數（即重複n次出現的項只計1次）。

函式如下：

dataframe.groupby([『分組的列名']).需要計數的列名.nunique()

陣列「data」如下：

storei程式設計客棧d

sales

salesdate

channel

a100

2018/1/1

01ibzmvf a90

2018/1/102a

1102018/1/201b

82.2

2018/1/101b

902018/1/2

02如果要按storeid來統計每一家店的營業日期數（可以通過不計重複的count 「salesdate」來完成）

**如下：

data.groupby(['storeid']).salesdate.nunique()

補充：pandas 統計分組內不重複計數

在資料分析中的資料處理過程中，經常需要對資料進行分組計數，看下下面這組資料

資料中name 為c 的有三行，其中有2個code是重複的

按name 分組，統計每組中code的不重複數量

df.groupby('name')[ibzmvf'code'].nunique()

# 以name 分組後，統計code的不重複數目

結果如下：

df.groupby('name')['code'].nunique().sort_values(ascending=false)

# 以name 分組後，統計code的不重複數目

本文標題: pandas 實現分組計數且不計重複

本文位址: /jiaoben/python/381931.html

Pandas中分組計數且不計重複的實現

在對dataframe進行分析的時候會遇到需要分組計數，計數的column中屬性有重複，但又需要僅對不重複的項計數即重複n次出現的項只計1次函式如下 dataframe.groupby 分組的列名需要計數的列名.nunique 舉例陣列 data 如下 storeid sales sales...

pandas基礎分組

outputs source import numpy as np n import pandas as pd source 分組 group source 生成資料 outputs execution count 22 metadata output type execute result sou...

pandas 分組聚合

綜合使用資料鏈結統計每個國家的星巴克的數量按照單字段聚合 codeing utf 8 import pandas as pd import numpy as np df pd.read csv data starbucks store worldwide.csv 按國家進行分組後會有很多列然...

Pandas 實現分組計數且不計重複

Pandas中分組計數且不計重複的實現

pandas基礎分組

pandas 分組聚合

相關推薦