import pandas as pd
2:讀入資料:
pd.read_csv(filepath,[param])
3:檢視資料的前五行:
pd.head()
pd.tail():檢視尾5行
4:檢視資料的一些情況:series.describe();對一列進行統計;
5:刪除列:pd.drop(columns,inplace) columns 接受乙個列表;inplace表示替代掉原來的資料;
6:改變資料的索引:這裡遇到過坑:
對於過濾了資料之後,可能有些下標已經不在了,要想再進行下一步處理操作的時候可能需要將下標重置一下,
剛開始用re_index()的時候沒有作用,下標還是沒有重置,用了reset_index()之後才其效果;
如果想要設定另外一列的下標作為新的一列就用set_index()
資料處理 pandas資料處理優化方法小結
資料處理時使用最多的就是pandas庫,pandas在資料處理方面很強大,整合了資料處理和資料視覺化。pandas的視覺化使用的是matplotlib。回到主題 計算資料的某個欄位的所有值,對其欄位所有值進行運算 處理的字段資料為時間戳,需要計算該時間戳距離現在的時間,單位為天。一般方法 使用現在的...
pandas常用的資料處理方法
pandas常用操作方法 資料去重及重置索引 data1 data.drop duplicates keep first inplace false data2 data1.reset index drop true 去掉time列裡面資料是0的所在行記錄 data1 data data time ...
Pandas 資料處理的基本方法
import pandas as pd,其中pd.series 類似與python中的字典,可傳入字典構造。支援相應的切片,若切片值為index則前後區間都包括在內 d 123 或者d 表示兩個index之前的全部數,顯示索引 若是數字切片,d 0 2 賊左閉右包,隱式索引。np.dataframe...