約定
import pandas as pd
dataframe中經常會出現重複行,利用duplicated()函式返回每一行判斷是否重複的結果(重複則為true),drop_duplicates([key1,key2,..])則可去除重複行。
1 判斷每一行是否重複
df1=pd.dataframe()
print(df1)
a b
0 1 a
1 1 a
2 1 b
3 2 b
4 2 b
5 3 c
df1.duplicated()
2 去除全部的重複行0 false
1 true
2 false
3 false
4 true
5 false
dtype: bool
print(df1.drop_duplicates())
3 指定列去除重複行a b
0 1 a
2 1 b
3 2 b
5 3 c
print(df1.drop_duplicates(['a']))
4 保留重複行中的最後一行a b
0 1 a
3 2 b
5 3 c
print(df1.drop_duplicates(['a'],keep='last'))
5 去除重複的同時改變dataframe物件a b
2 1 b
4 2 b
5 3 c
df1.drop_duplicates(['a','b'],inplace=true)
print(df1)
謝謝大家的瀏覽,a b
0 1 a
2 1 b
3 2 b
5 3 c
希望我的努力能幫助到您,
共勉!
Swift 學習之二十一 ?和 !(詳解)
swift語言使用var定義變數,但和別的語言不同,swift裡不會自動給變數賦初始值,也就是說變數不會有預設值,所以要求使用變數之前必須要對其初始化 如果在使用變數之前不進行初始化就會報錯 plain view plain copy print var stringvalue string err...
(二十一)Python學習之模組初識
一 模組的概念 在python中,乙個.py檔案就稱之為乙個模組 module 使用模組最大的好處是提高了 的可維護性。二 模組的分類 1 python標準庫 2 第三方模組 3 應用程式自定義模組 三 模組的匯入方法 1.import 語句 import module1 module2 modul...
設計模式二十一之命令模式
2.模式的結構與實現 在軟體開發系統中,常常出現 方法的請求者 與 方法的實現者 之間存在緊密的耦合關係。這不利於軟體功能的擴充套件與維護。例如,想對行為進行 撤銷 重做 記錄 等處理都很不方便,因此 如何將方法的請求者與方法的實現者解耦?變得很重要,命令模式能很好地解決這個問題。在現實生活中,這樣...