pandas去重複行並分類彙總的實現方法

2022-10-04 18:06:13 字數 806 閱讀 1296

今天主要記錄一下pandas去重複行以及如何分類彙總。以下面的資料幀作為乙個例子: 

import pandas as pd

data=pd.dataframe()

pandas判斷dataframe是否含有重複行資料用:df.duplicated()

第一次出現的資料為false.重複的資料行就被記錄為true。

去掉重複行資料使用data.dr

可以看到索引亂了,我們使用data.reset_index(),裡面的引數drop=true,表明要捨掉原來的索引,不然的話原來的索程式設計客棧引會保留下來。

分類彙總主要使用groupby(表明彙總的條件列)以及agg(要彙總的字段/列以及彙總的方式:求和還是最大最小值或者計數)。完整**如下圖

# -*- coding: utf-8 -*-

"""created on fri jul 20 09:08:10 2018

@author: fanxiaolei

"""import pandas as pd

data=pd.dataframe()

if data.duplicated:

dataa=pjblrxxonbdata.drop_duplicates().reset_index(drop=true)

print(dataa)

datab=dataa.groupby(by='產品').agg()

print('資料彙總結果:')

print(datab)

結果展示如下圖:

本文標題: pandas去重複行並分類彙總的實現方法

本文位址:

SQL行轉列並分類彙總

create table temp employeename nchar 10 paycategory nchar 12 amount numeric 10,2 insert into temp employeename,paycategory,amount values 王五 吃飯 10.2 in...

pandas 去除重複行

方法 dataframe.drop duplicates subset none,keep first inplace false 1引數 這個drop duplicate方法是對dataframe格式的資料,去除特定列下面的重複行。返回dataframe格式的資料。subset column la...

pandas 去掉 保留重複行

應用場景 假如我們有如下的乙個資料集,6行4列。此時,我們3個想法。第乙個想法 把所有重複的行去掉 第二個想法 只保留第一次出現的重複行 第三個想法 保留最後一次出現的重複行 這三個想法都可以用pandas中自帶乙個方法實現。dataframe.drop duplicates 具體實現如下 impo...