Seaborn 單變數分析(三)

2021-10-05 17:24:23 字數 2054 閱讀 5380

%matplotlib inline

import numpy as np

import pandas as pd

from scipy import stats, integrate

import matplotlib.pyplot as plt

import seaborn as sns

sns.

set(color_codes=

true

)np.random.seed(

sum(

map(

ord,

"distributions"))

)

#直方圖

x = np.random.normal(size=

100)

#隨機生成高斯資料

sns.distplot(x,kde=

false

)#kde要不要做核密度估計

#20個bins

sns.distplot(x, bins=

20, kde=

false

)

資料分布情況

x = np.random.gamma(

6, size=

200)

sns.distplot(x, kde=

false

, fit=stats.gamma)

#fit當前的統計指標

#根據均值和協方差生成資料

mean, cov =[0

,1],

[(1,

5),(

5,1)

]data = np.random.multivariate_normal(mean, cov,

200)

df = pd.dataframe(data, columns=

["x"

,"y"

])

觀測兩個變數之間的分布關係最好用散點圖

#jointplot  繪製xy之間關係  以及單變數的直方圖

#資料量很大時,可以使用hex檢視哪一塊資料量最多,顏色越深,當前附近值的越多。

#鳶尾花資料集  包含花瓣和花萼之間的關係 花瓣的長度  花瓣的寬度  花萼的長度  花萼的寬度

iris = sns.load_dataset(

"iris"

)sns.pairplot(iris)

#檢視兩兩之間的關係

#對角線是當前變數自身分布的情況,非對角線是不同特徵之間的關係。

Seaborn實現單變數分析

import numpy as np import pandas as pd from scipy import stats,integrate import matplotlib.pyplot as plt import seaborn as sns 繪製直方圖 sns.set color cod...

活躍變數分析

1 定義 對於變數x和程式點p,判斷x在點p上的值是否會在流圖中的某條從點p出發的路徑中使用。如果是,就說x在p上活躍 否則就說x在p上是死的。2 用途 重要用途之一是為基本塊進行儲存器分配。乙個值被計算儲存到乙個暫存器中後,很有可能在基本塊中被使用。如果它在基本塊中是死的,就不必在結尾處儲存這個值...

seaborn 單變數分布 雙變數分布

第七課 資料視覺化 第13節 資料集分布視覺化 1 單變數分布 雙變數分布 import seaborn as sns import numpy as np import matplotlib.pyplot as plt sns.version 0.8.1 單變數分布 核密度估計圖 data1 np...