Pandas 實現分組計數且不計重複

2022-09-25 22:57:16 字數 916 閱讀 2962

在對dataframe進行分析的時候會遇到需要分組計數,計數的column中屬性有重複,但又需要僅對不重複的項計數(即重複n次出現的項只計1次)。

函式如下:

dataframe.groupby([『分組的列名']).需要計數的列名.nunique()

陣列「data」如下:

storei程式設計客棧d

sales

salesdate

channel

a100

2018/1/1

01ibzmvf a90

2018/1/102a

1102018/1/201b

82.2

2018/1/101b

902018/1/2

02如果要按storeid來統計每一家店的營業日期數(可以通過不計重複的count 「salesdate」來完成)

**如下:

data.groupby(['storeid']).salesdate.nunique()

補充:pandas 統計分組內不重複計數

在資料分析中的資料處理過程中,經常需要對資料進行分組計數,看下下面這組資料

資料中name 為c 的有三行,其中有2個code是重複的

按name 分組,統計每組中code的不重複數量

df.groupby('name')[ibzmvf'code'].nunique()

# 以name 分組後,統計code的不重複數目

結果如下:

df.groupby('name')['code'].nunique().sort_values(ascending=false)

# 以name 分組後,統計code的不重複數目

本文標題: pandas 實現分組計數且不計重複

本文位址: /jiaoben/python/381931.html

Pandas中分組計數且不計重複的實現

在對dataframe進行分析的時候會遇到需要分組計數,計數的column中屬性有重複,但又需要僅對不重複的項計數 即重複n次出現的項只計1次 函式如下 dataframe.groupby 分組的列名 需要計數的列名.nunique 舉例 陣列 data 如下 storeid sales sales...

pandas基礎分組

outputs source import numpy as np n import pandas as pd source 分組 group source 生成資料 outputs execution count 22 metadata output type execute result sou...

pandas 分組聚合

綜合使用 資料鏈結 統計每個國家的星巴克的數量 按照單字段聚合 codeing utf 8 import pandas as pd import numpy as np df pd.read csv data starbucks store worldwide.csv 按國家進行分組後會有很多列 然...