在對dataframe進行分析的時候會遇到需要分組計數,計數的column中屬性有重複,但又需要僅對不重複的項計數(即重複n次出現的項只計1次)。
函式如下:
dataframe.groupby([『分組的列名']).需要計數的列名.nunique()
陣列「data」如下:
storei程式設計客棧d
sales
salesdate
channel
a100
2018/1/1
01ibzmvf a90
2018/1/102a
1102018/1/201b
82.2
2018/1/101b
902018/1/2
02如果要按storeid來統計每一家店的營業日期數(可以通過不計重複的count 「salesdate」來完成)
**如下:
data.groupby(['storeid']).salesdate.nunique()
補充:pandas 統計分組內不重複計數
在資料分析中的資料處理過程中,經常需要對資料進行分組計數,看下下面這組資料
資料中name 為c 的有三行,其中有2個code是重複的
按name 分組,統計每組中code的不重複數量
df.groupby('name')[ibzmvf'code'].nunique()
# 以name 分組後,統計code的不重複數目
結果如下:
df.groupby('name')['code'].nunique().sort_values(ascending=false)
# 以name 分組後,統計code的不重複數目
本文標題: pandas 實現分組計數且不計重複
本文位址: /jiaoben/python/381931.html
Pandas中分組計數且不計重複的實現
在對dataframe進行分析的時候會遇到需要分組計數,計數的column中屬性有重複,但又需要僅對不重複的項計數 即重複n次出現的項只計1次 函式如下 dataframe.groupby 分組的列名 需要計數的列名.nunique 舉例 陣列 data 如下 storeid sales sales...
pandas基礎分組
outputs source import numpy as np n import pandas as pd source 分組 group source 生成資料 outputs execution count 22 metadata output type execute result sou...
pandas 分組聚合
綜合使用 資料鏈結 統計每個國家的星巴克的數量 按照單字段聚合 codeing utf 8 import pandas as pd import numpy as np df pd.read csv data starbucks store worldwide.csv 按國家進行分組後會有很多列 然...