最近在自己做乙個庫存管理系統,想用pandas的drop_duplicates()方法刪除掉重複的資訊,上網搜了一下,沒找到什麼好的解決方案,於是發表一下自己的解決方案。
首先我在命令列裡讀取了excel裡面的內容,可以從1看到索引為3和4的訂單重複.
然後呼叫了drop_duplicates方法,圖2顯示刪除成功.
再次檢視df, 卻沒有任何改變,見圖3.
操作和結果見圖4,直接用df.drop_duplicates()給df賦值就能完成刪除重複資訊的操作.
類似於以上做法,直接貼出整段**,主要區別是dataframe裡面直接傳入經過刪除重複資訊操作後的資料.
def delete_same(xlsx_path):
df = pd.read_excel(xlsx_path)
pd.dataframe(df.drop_duplicates()).to_excel(xlsx_path, index=false, header=true)
drop duplicates去重詳解
根據資料的不同情況及處理資料的不同需求,通常會分為兩種情況,一種是去除完全重複的行資料,另一種是去除某幾列重複的行資料,就這兩種情況可用下面的 進行處理。1.去除完全重複的行資料 data.drop duplicates inplace true 2.去除某幾列重複的行資料 data.drop du...
今天沒喝酒
協議終於還有五天就到期了,我的去留問題一直懸而未決,公司做了乙個多月的思想工作了,協議都寄給我乙個多星期了,我搞到今天還沒有拆封。明顯的感覺到冬天已經來了,上個週末去買了件毛衣。忽然發現自己很浪費,經常到處跑,帶那麼多衣服的確不方便,所以每年冬天的裝備都必須要現買,錢花了不少,衣服卻遍布各地。最近的...
移動辦公沒那麼簡單,也沒那麼難
一提起移動辦公,大家想到的就是用手機,用筆記本處理繁瑣的工作,這只是簡單的一方面,並不是移動辦公的全部,乙個正確的載體出現了,把工作的每乙個流程,每乙個細節整合起來放到乙個固定的系統上,在通過系統分解到每乙個專案流,每乙個成員上,按照工作流操作日常繁瑣的工作,最後形成閉環以資料的形式呈現給企業管理者...