具體操作詳見:
鏈結 multiindex
series
通過類似字典標記的方式或屬性的方式,可將dataframe的列獲取為乙個series 物件[『列名』]
建立dataframe,修改index和columns
建立日期
行索引,叫index,axis=0
列索引,叫colums,axis=1
物件.head() 物件.tail()索引
iloc
index物件是不可修改的 index = 物件.index index[1] = 『d』 錯誤
index的方法和屬性
物件.reset_index(drop=false)
物件.set_index(drop=true,keys=)
物件.reindex(index=,method=』』,colums=) 建立乙個適應新索引的新物件
修改行或列名
賦值操作 排序
算術運算
統計運算
新增新的列
nlargest函式返回前幾個大的元素值
自定義運算
func可以為匿名函式
del 物件.[『列名』] 刪除列
讀取檔案
pd.read_table() 預設分隔符為製表符\t
pd.load()
pd.to_csv(路徑 , sep = 『,』 , columns= ,header=true,index = true ,)
pd.read_hdf(路徑, key = none, ** kwargs)
pd.to_hdf(***.h5,key = )
pd.read_json(路徑,orient=,type=,lines= )
pd.to_json(路徑,orient=)
import json
推薦實用hdf
處理缺失值
物件[列名].fillna(value = 物件[列名].mean())
替換思路 把 ?替換為np.nan
物件.repalce(to_replace=需要替換的值 ,value=替換後的值 )
資料離散化
資料合併
交叉表和透視表
分組與聚合
層次化索引
pandas高階操作總結
1.pandas中的列的分位數 檢視列的分位數 import pandas as pd set columns type my df col my df col astype np.float64 computations for 4 quantiles quartiles bins col pd....
Pandas基本操作總結 資料篩選loc
1 loc篩選 loc為普遍用法 得到單個值 df.loc e行 f列 df.loc a行 b列 f列 e列 列表批量查詢 df.loc a行 b行 f行 b列 f列 e列 區間範圍連續查詢 df.loc a行 c行 b列 c列 條件表示式查詢 df.loc df c列 0,篩選c列 0,顯示滿足條...
Pandas使用總結
第一參加阿里天池舉辦的比賽,關於美年雙高 的比賽,成績0.08。因為之前只學習過理論,沒有具體做過專案,對python會一些,但對pandas基本從零開始。比賽初期基本copy大佬的資料處理部分的 後面再在此基礎上修改。天池的比賽,比較貼近實際的專案,還是很有參與價值的。在這個比賽中,我也認識到了特...