pandas dataframe 去重函式

2021-09-19 09:11:56 字數 551 閱讀 8339

from pandas import series, dataframe

data = dataframe(

)isduplicated = data.duplicated(

)print isduplicated

print

type

(isduplicated)

data = data.drop_duplicates(

)

0

false

1true

2false

3true

k01

22

dataframe的duplicated方法返回乙個布林型series,表示各行是否重複行。

drop_duplicates方法,它用於返回乙個移除了重複行的dataframe

這兩個方法會判斷全部列,你也可以指定部分列進行重複項判段。

例如,希望對名字為k2的列進行去重,

Pandas DataFrame用法總結

1 將某一列滿足條件的資料的所在行提取出來 df ori pd.read excel f ivf data data add yuejing time data arrange no null23.xlsx df new df ori df ori.iloc 2 0.6 將某一列滿足條件 0.6 的...

Pandas DataFrame常用方法

1 獲取列名 1.1.鍊錶推導式 語法 col for col in df 返回結果 cvr1 cvr2 cvr3 cvr4 結果型別 list 1.2.通過columns屬性 columns屬性返回index,columns.values屬性返回 numpy.ndarray,可通過 tolist ...

Pandas DataFrame 按行構建

當我們從複雜 提取出逐個樣本的特徵時,繼而構成一條樣本並組成訓練或測試集時,比較容易想到的一點就是一行一行地構建dataframe。而pandas.dataframe 容許的輸入有numpy ndarray structured or homogeneous dict,or dataframe這些 ...