pandas資料處理

2021-09-24 06:19:00 字數 823 閱讀 8424

dataframe.duplicated(subset=none, keep='first')  判斷dataframe中的資料是否有重複(必須一行中所有資料都重複才算重複,只能判斷行,不能判斷列)返回series

dataframe.drop_duplicates(subset=none, keep='first', inplace=false)刪除重複一行的所有資料。

字典屬於對映,鍵和值對應。

dataframe.replace(to_replace=none, value=none, inplace=false, limit=none, regex=false, method='pad')傳乙個字典做為查詢替換的依據(不能傳函式)

map()可以傳函式做為對映依據,可以對資料進行判斷

pandas 資料處理

pandas中資料可以分為series,dataframe,panel分別表示一維至三維資料。其中在構造時,index表示行名,columns表示列名 構造方式 s pd.series data index index s pd series np random randn 5 index a b ...

Pandas資料處理

資料處理 pandas from sklearn.preprocessing import minmaxscaler data 1,2 0.5,6 0.10 1,18 將 numpy 轉換成 pd 表 pd.dataframe data 歸一化 0,1 之間 scaler minmaxscaler ...

Pandas資料處理

原始資料如下 型別為datetime 要拆分上述資料,分別將日期和時間賦予到不同的列。原始資料為data,型別為datetime test1 hour data timestamp map lambda x x.strftime h test1 hour data timestamp map lam...