Seaborn學習筆記(二)

2021-08-20 09:40:36 字數 3308 閱讀 1208

之前學習了解的都是seaborn的資料繪製時候的美化功能,只是為了使得繪製出的圖形更加好看,seaborn同樣提供了許多的用於展示資料相互關係的繪圖函式。

seaborn繪製資料集的分布

1. 繪製單變數分布

最簡便快速檢視seaborn中單變數分布的是distplot()方法。預設情況下,這將繪製資料的直方圖並擬合核心密度估計值(kde)。

上邊是使用distplot()繪製了乙個變數分布的總體密度估計圖,我們也可以選擇在直方圖中顯示出具體每個資料在直方圖區間的位置

#還是使用隨機生成的資料,但是設定rug為true

x = np.random

.normal(size=100)

sns.distplot(x, kde=false, rug=true);

我們可以看到具體的資料的密度分布情況,而不是擬合的曲線

同樣的,我們也可以只顯示具體資料的密度分布和他的對應擬合曲線

若是我們只是需要繪製資料分布密度的概覽,而不是需要繪製直方圖,我們可以直接使用seaborn中提供的kdeplot()函式,上邊的distplot()也是通過呼叫它來顯示密度分布擬合曲線的

#直接顯示密度分布的擬合曲線,而不是繪製直方圖

我們可以通過bw引數來控制擬合曲線的精細程度,就類似於繪製直方圖時的bins引數一樣

#使用預設的bw引數

sns.kdeplot(x)

#調整bw引數,使得顯示出來的密度分布擬合曲線更加接近資料

2. 繪製雙變數分布seaborn提供了用於描述雙變數分布情況的繪圖函式,可以直觀的檢視雙變數的分布情況。該函式建立乙個多面板圖形,顯示兩個變數之間的二元(或關節)關係以及每個單獨軸上的單變數(或邊際)分布。

此外seaborn還提供了直方圖中的二元關係圖,也常被稱為「六邊形圖」,該圖對於較大的資料集效果最好。

也可以使用核密度圖來估計二元變數的關係,在seaborn中會以輪廓圖的形式顯示出來

seaborn也允許將這型別的圖繪製到已經用matplotlib繪製出來的軸上

#先用matplotlib繪製出座標軸

f, ax = plt.subplots(figsize=(6, 6))

#用seaborn將需要展示的圖繪製到matplotlib軸上

可以使用kdeplot()中的n_levels引數來控制輪廓的數量,使得顯示的更加連續或者是稀疏

f, ax = plt.subplots(figsize=(6, 6))

#用n_levels引數控制顯示的疏密程度

3. 展示資料集中的成對關係要在資料集中繪製多個成對的雙變數分布,可以使用該pairplot()函式。這將建立乙個軸矩陣並顯示dataframe中每對列的關係。預設情況下,它也繪製每個變數在對角軸上的單變數分布。

一下使用的是鳶尾花資料集來展示這一效果

iris = sns.load_dataset("iris")

sns.pairplot(iris);

可以看到起使用多個子圖來展示兩個特徵的資料之間的相互關係,同時也在對角線上繪製了每個單變數的分布情況。

seaborn學習筆記一

簡單粗暴先上官網這裡哦 在matplotlib的基礎上進行更高階的api封裝 就只需要乙個簡單的命令 從而使得作圖更加容易 優勢 繪製漂亮圖表,資料分析而設計的繪製庫,能與pandas很好結合 在cmd使用pip命令,如果以前安裝了檢視版本,最新是0.9.0 import seaborn as sn...

Seaborn教程學習

seaborn介紹 seaborn環境設定 seaborn匯入資料集和庫 seaborn figure aesthetic seaborn調色盤 seaborn直方圖 seaborn核密度估計 seaborn視覺化成對關係 seaborn繪製分類資料 seaborn觀測分布 seaborn統計估計 ...

seaborn中的barplot學習記錄

barplot 可以將一些統計函式的結果顯示在圖示上。其中,estimator 指定分組彙總的方式,傳入乙個函式的引用就可以了,預設是取平均值。以鐵達尼號生存 資料集來說 探索sibsp堂兄弟 妹個數與生存關係 sns.barplot x sibsp y survived data train 等同...