pandas支援包含csv,excel,hdf,sql,json,html,stata,sas,clipboard,pickle等格式的資料檔案儲存,以統一的命名風格訪問,以csv為例
pd.read_csv()
pd.to_csv()
matplotlib 是python自帶的繪圖工具包,功能十分強大,在使用pandas進行資料分析時往往需要進行資料視覺化,在此只記錄最基本的用法。
import matplotlib.pyplot as plt
隨機生成一組資料,每行為一條記錄,每條記錄包含x,y兩個值
data = pd.dataframe(np.random.randn(100,2),columns=list("xy"))
plt.show()展示繪製好的圖形,視覺化的最後一步
pd.plot()
基本的線性繪圖函式,可以通過引數指定繪製的顏色、線型
具體引數可參閱這裡
pd.plot.scatter()散點圖繪製方法,需要指定x,y座標軸
除此之外,還可以用來繪製條形圖、餅圖、直方圖等統計影象,在此不作介紹
pandas學習筆記
import numpy as np import pandas as pd obj2 pd.series 4,7,5,3 index d b a c obj2 out 99 d 4 b 7 a 5 c 3 dtype int64 a b pd.series a bout 102 a 1 b 2 c...
pandas學習筆記
1 建立物件,瀏覽資料 建立物件,瀏覽資料 import pandas as pd import numpy as np import matplotlib.pyplot as plt 建立series s pd.series 1,2,4,6,np.nan,9,10 index list abcde...
pandas學習筆記
1.series 類似numpy中的一維陣列,表示為索引 從0開始 和值。建立 import pandas as pd,numpy as np s1 pd.series np.arange 10 s2 pd.series 12 2,5 s3 pd.series 含有的屬性 s1.values s1....