1.開啟csv檔案使用data= pandas.csv_file(filename)
如果開啟的資料是亂碼則,在引數裡面設定下encoding
2.讀取前m行 、後m行分別使用data.head(m)和data.tail(m)
3.使用groupby().sum後索引變為了multiindex不能在對其使用dataframe的相關操作,此時呼叫reset_index()就可以了。
如果採用groupby後保持原來的索引則設定引數as_index=false
tmp
.groupby
(['key1'
,'key2'
],as_index
=false).
sum()
4.讀寫csv檔案
讀取 pd.read_csv('foo.csv')
寫入 df.to_csv('foo.csv')
5.更改dataframe列的順序兩種方法
例子:原來的frame 列的順序為:['a','b','c'] 要將第』b'列移至末尾
方法一:
cols = list(df)
cols.insert(2, cols.pop(cols.index('b')))
df = df.ix[:, cols]方法二:
bcol = df['b']df.drop(labels=['b
'], axis=1,inplace = true)
df.insert(2, 'b
', bcol)
Python包之Pandas介紹
前言 pandas 是乙個開源的軟體庫。dataframes和series是其兩個主要資料結構,被廣泛用於資料分析。series 是單維索引陣列,而dataframes 是具有列級和行級索引的 資料結構。pandas 是預處理資料集的絕佳工具,可提供高度優化的效能。numpy介紹 下面是詳細介紹 用...
Python強大的pandas包常用函式
import pandas as pd filepath01 r f data temp gd net loss data demo01.csv data01 pd.read csv filepath01 print data01.head 5 print data01.columns 返回全部列名...
python包pandas安裝和入門
如果用anaconda安裝python的話,可以直接使用conda install或者pip install。e anaconda3 c users conda install pandas或者 pip install pandas2.1資料預處理 資料預處理 import pandas as pd...