一、pandas簡介
pandas:panel data analysis(面板資料分析),是基於numpy 構建的含有更高階資料結構和工具的資料分析包,類似於numpy ,pandas也是圍繞著series和dataframe兩個核心資料結構展開的。series 和 dataframe 分別對應於一維的數列和二維的表結構。pandas的匯入方式如下:
import pandas as pd
from pandas import series,dataframe
1.建立物件
1.1,可以通過傳遞乙個list物件來建立乙個series,pandas預設建立整型索引:
import numpy as np
import pandas as pd
from pandas import series,dataframe
s=series([1,2,3,4,np.nan,6])
print(s)
0 1.0
1 2.0
2 3.0
3 4.0
4 nan
5 6.0
dtype: float64
1.2,通過傳遞乙個能夠被轉換成類似序列結構的的字典物件來建立乙個dataframe:
from pandas import series,dataframe
data=
s=dataframe(data)
print(s)
pop state year
0 1.5 yes 2000
1 1.7 yes 2001
2 3.6 yes 2002
3 2.4 no 2003
4 2.9 no 2004
1.3,檢視資料型別和檢視資料
print(s.dtypes)
print(s.head(1))
print(s.tail(2))
pop float64
state object
year int64
dtype: object
pop state year
0 1.5 yes 2000
pop state year
3 2.4 no 2003
4 2.9 no 2004
Python中的Pandas模組
目錄 pandas series 序列的建立 序列的讀取 dataframe dataframe的建立 dataframe資料的讀取 panel panel的建立 pandas python data analysis library 是基於numpy 的一種工具,該工具是為了解決資料分析任務而建立...
Python中pandas的qcut函式的用法
在 利用python進行資料分析 這本書的第七章介紹了pandas的qcut函式的用法。原書介紹qcut函式是乙個與分箱密切相關的函式,它基於樣本分位數進行分箱,可以通過qcut獲得等長的箱 data np.random.randn 1000 data服從正態分佈 cats pd.qcut data...
python中pandas的幾種合併
import pandas as pd import numpy as np 1 上下合併 df1 pd.dataframe np.ones 2,4 0,columns a b c d df2 pd.dataframe np.ones 2,4 1,columns a b c d 兩行四列,每一列分別...