Pandas學習筆記(3) 資料訪問與視覺化

2021-08-15 10:14:20 字數 1020 閱讀 1587

pandas支援包含csv,excel,hdf,sql,json,html,stata,sas,clipboard,pickle等格式的資料檔案儲存,以統一的命名風格訪問,以csv為例

pd.read_csv()

pd.to_csv()

matplotlib 是python自帶的繪圖工具包,功能十分強大,在使用pandas進行資料分析時往往需要進行資料視覺化,在此只記錄最基本的用法。

import matplotlib.pyplot as plt
隨機生成一組資料,每行為一條記錄,每條記錄包含x,y兩個值

data = pd.dataframe(np.random.randn(100,2),columns=list("xy"))
plt.show()展示繪製好的圖形,視覺化的最後一步

pd.plot()

基本的線性繪圖函式,可以通過引數指定繪製的顏色、線型

具體引數可參閱這裡

pd.plot.scatter()散點圖繪製方法,需要指定x,y座標軸

除此之外,還可以用來繪製條形圖、餅圖、直方圖等統計影象,在此不作介紹

pandas學習筆記

import numpy as np import pandas as pd obj2 pd.series 4,7,5,3 index d b a c obj2 out 99 d 4 b 7 a 5 c 3 dtype int64 a b pd.series a bout 102 a 1 b 2 c...

pandas學習筆記

1 建立物件,瀏覽資料 建立物件,瀏覽資料 import pandas as pd import numpy as np import matplotlib.pyplot as plt 建立series s pd.series 1,2,4,6,np.nan,9,10 index list abcde...

pandas學習筆記

1.series 類似numpy中的一維陣列,表示為索引 從0開始 和值。建立 import pandas as pd,numpy as np s1 pd.series np.arange 10 s2 pd.series 12 2,5 s3 pd.series 含有的屬性 s1.values s1....