資料處理方法總結

2021-08-29 02:10:09 字數 509 閱讀 7298

#讀取資料

data=pd.read_csv("")

print(data.head(10))

#處理資料

#1.縮小資料,查詢資料篩選,query相當於sql語句,進行條件查詢

data=data.query("x>1.0 & x<1.25 & y>2.5 & y<2.75")

#2.處理時間處理

time_value=pd.to_datetime(data['time'],unit='s')#轉換成時間格式,精確到秒

print(time_value)

#把日期格式轉換成字典格式

time_value=pd.datatimeindex(time_value)

#構造一些特徵

data['day']=time_value.day

#把原來的時間戳特徵刪除

data=data.drop(['time'],axis=1)#按列刪除

海量資料處理方法總結

適用範圍 第k大,中位數,不重複或重複的數字 基本原理及要點 因為元素範圍很大,不能利用直接定址表,所以通過多次劃分,逐步確定範圍,然後最後在乙個可以接受的範圍內進行。可以通過多次縮小,雙層只是乙個例子。擴充套件 問題例項 1 2.5億個整數中找出不重複的整數的個數,記憶體空間不足以容納這2.5億個...

資料處理 pandas資料處理優化方法小結

資料處理時使用最多的就是pandas庫,pandas在資料處理方面很強大,整合了資料處理和資料視覺化。pandas的視覺化使用的是matplotlib。回到主題 計算資料的某個欄位的所有值,對其欄位所有值進行運算 處理的字段資料為時間戳,需要計算該時間戳距離現在的時間,單位為天。一般方法 使用現在的...

資料處理常用方法

列值替換 data.trade type data.trade type 21 1 data.trade type data.trade type 22 0取消索引 wo.to csv szy.csv index false 檢視所有列的空缺值 data.isnull sum 檢視每列的值的數量 d...