import pandas as pd
f = pd.read_excel(
'name.xlsx'
,'sheet_name'
)# 檢視有重複的行
re_row = f.duplicated(
)# 去除重複行資料
# drop_duplicates(subset=' 列名',keep='firsrt',inplace='true')函式是刪除dataframe的某列中重複項的函式。
no_re_row = f.drop_duplicates(
)# 可以指定刪除哪一列重複資料
no_re_row = f.drop_duplicates(
['c_content'])
# 儲存檔案
f.to_excel(
'name.xlsx'
)# 儲存檔案,無index
f.to_excel(
'name.xlsx', index=
none
)# 儲存檔案,無表頭
f.to_excel(
'name.xlsx', header=
none
)
按照行列刪除指定行列
# drop用法
print
(df_excel.drop(
['edu'
],axis=1)
)#按照列刪除edu這一列
print
(df_excel.drop([0
],axis=0)
)#按照行刪除0這一行
待更新…
pandas讀取csv檔案
import pandas as pd
name =
'tls_icd10cmhumanreadablemap_us1000124_20210301.tsv'
df = pd.read_csv(name,sep=
'\t'
)# 讀取某列元素
df.loc[
'col_name'
]# 刪除兩列元素
df.drop(
['col_name1','col_name2'
],axis=1)
# df.drop(columns=['col_name1','col_name2'])
# 根據某列元素,讀取對應行
df.loc[df[
'referencedcomponentid']==
9982009
]
參考:python 刪除excel**重複行,資料預處理操作 乾貨 利用pandas處理Excel資料
新建乙個excel table1.csv 用於案例講解 df pd.read excel table1.xlsx 相對路徑 df pd.read excel r e anaconda hc datascience table1.csv 絕對路徑 顯示資料的行與列數 df.shape 6,5 顯示資料...
基於pandas的excel資料處理
實現目的 將實驗資料 excel格式 根據date列中資料按照年份劃分成多個資料集並輸出。使用pandas讀取excel檔案未dataframe格式,然後獲取其中date列的資料並進行取最後四位數的操作,迴圈結果所需要的資料集進行判斷 with open filename,r encoding ut...
Excel檔案處理之pandas
pandas可以用來處理多種儲存型別的資料,比如excel csv html sql.檢視pandas.read xx方法可以看出。本文主要總結對excel的處理。pandas依賴處理excel的xlrd等模組,這些模組安裝即可,不需要import。1讀取 1.1多個sheet import pan...