用python完成資料分析後,如何把結果呈現出來,比如畫乙個吸引人注意的圖表相當重要。當你探索乙個資料集,需要畫圖表,圖表看起來令人愉悅是件很高興的事。在給你的觀眾交流觀點,給領導匯報工作時,視覺化同樣重要,同時,也很有必要去讓圖表吸引注意力和印入腦海裡。
在python中numpy,pandas,matplotlib,seaborn是幾個重要的模組。matplotlib自動化程度非常高,但是,掌握如何設定系統以便獲得乙個吸引人的圖是相當困難的事。為了控制matplotlib圖表的外觀,seaborn模組自帶許多定製的主題和高階的介面。
anaconda版本的安裝很方便,利用conda命令能隨時查詢和更新、安裝模組,相當便利。
conda list
列出所有的已安裝的packages模組
conda install name
name是需要安裝packages的名字,比如,我需要安裝numpy包,輸入上面的命令就是:
conda install numpy
單詞之間空一格,然後回車,輸入y就可以了
這裡在windows安裝的anaconda裡選擇開啟ipython程式。在畫圖之前,請注意設定顯示環境,輸入命令:
%matplotlib inline
表示在命令列顯示
%matplotlib qt
表示在顯示
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
np.random.seed(sum(map(ord, "aesthetics")))
先完成準備工作,引用需要的第三方模組。
接著讓我們定義乙個正弦函式,並畫出來,這將幫助我們了解我們可以控制的不同風格的引數
def
sinplot
(flip=1):
x = np.linspace(0, 14, 100)
for i in range(1, 7):
plt.plot(x, np.sin(x + i * .5) * (7 - i) * flip)
預設情況下matplotlib顯示的如下:
我們再嘗試一下seaborn的畫圖效果:
import seaborn as sns
sinplot()
seaborn將matplotlib的引數劃分為兩個組。第一組控制圖表的樣式和圖的度量尺度元素,這樣就可以輕易在納入到不同的上下文中。
操控這些引數由兩個函式提供介面。控制圖的樣式,用axes_style()和set_style()這兩個函式。度量圖則用plotting_context()和set_context()這兩個函式。在這兩種情況下,第一組函式返回一系列的引數,第二組則設定matplotlib的預設屬性。
end
資料視覺化總結
numpy 提供陣列支援,以及相應的高效的處理函式 scipy 提供矩陣支援,以及矩陣相關的數值計算模組 matplotlib 資料視覺化工具,作相簿 pandas 強大 靈活的資料分析和探索工具 statsmodels 設計建模,統計模型估計,描述統計等 scikit learn 支援回歸 分類 ...
資料視覺化 總結
突然要做ppt,但是一般ppt的工具可以做的圖示太小了,雖然ppt中的圖示展示較少,更多的是流程圖 時序圖,但是有時候一些優秀的展示方式也可以讓我們的ppt更完美,ppt我覺得重點是內容,怎麼在一張空白頁上展示內容,有些圖 表可以幫助聽眾更快了解內容,消化內容,所以就想想,怎麼來展示我們的資料和內容...
Python資料視覺化2 9 總結
2.9 總結 建立乙個有效的故事應遵守視覺化方法的原則。本章中的故事給了有關出美學方面的想法和方法的巨大變化。資料視覺化的目標是通過所選方法的視覺展示 清晰有效得與使用者交流資訊。有效的視覺化有助於分析和推理資料和證據。這使得複雜資料更容易接觸 理解和使用。使用者可能有特殊的分析任務,比如進行比較或...