pandas處理資料
1、建立資料
建立series,讓pandas建立乙個索引
2檢視資料
檢視框架的頂行和底行
head()
tail()
顯示索引、列、基礎numpy資料
index
columns
values
describe()
顯示快速統計摘要
3、缺少資料
刪除缺少資料的行
line.dropna(how=』any』)
填寫缺少的資料
line.fillna(value=5)
4、將函式應用於資料
5、讀寫資料
寫df.to_csv(『foo.csv』)
讀pd.read_csv(『foo.csv』)
寫df.to_hdf(『foo.h5』,』df』)
讀pd.read_hdf(『foo.h5』,』df』)
寫df.to_excel(『foo.xlsx』,sheet_name=』sheet1』)
讀pd.read_excel(『foo.xlsx』,』sheet1』,index_col=none,na_values=[』na』])
Pandas簡單資料處理
對乙個人連線ap的資料進行處理,來得出其大致行程 將其轉換為dataframe,二維 有列,第一列是apmac 無線ap的硬體位址 第二列是mac 登陸者使用裝置的mac位址 第三列是手機號,第四列為連線當前ap的時間,第五列為斷開當前ap的時間。本次資料處理的目的是進行簡單聚類,比如a同學連線ap...
pandas處理資料
pd.read csv path to file.txt header 0,names ab index 0 names columns這個可以不寫,制定索引列是第一列,這樣就沒有序號 np.tofile d python np.txt 類似於二維列表 充分利用map函式 df.a df.a.map...
pandas 資料處理
pandas中資料可以分為series,dataframe,panel分別表示一維至三維資料。其中在構造時,index表示行名,columns表示列名 構造方式 s pd.series data index index s pd series np random randn 5 index a b ...