%matplotlib inline
import numpy as np
import pandas as pd
from scipy import stats, integrate
import matplotlib.pyplot as plt
import seaborn as sns
sns.
set(color_codes=
true
)np.random.seed(
sum(
map(
ord,
"distributions"))
)
#直方圖
x = np.random.normal(size=
100)
#隨機生成高斯資料
sns.distplot(x,kde=
false
)#kde要不要做核密度估計
#20個bins
sns.distplot(x, bins=
20, kde=
false
)
資料分布情況
x = np.random.gamma(
6, size=
200)
sns.distplot(x, kde=
false
, fit=stats.gamma)
#fit當前的統計指標
#根據均值和協方差生成資料
mean, cov =[0
,1],
[(1,
5),(
5,1)
]data = np.random.multivariate_normal(mean, cov,
200)
df = pd.dataframe(data, columns=
["x"
,"y"
])
觀測兩個變數之間的分布關係最好用散點圖
#jointplot 繪製xy之間關係 以及單變數的直方圖
#資料量很大時,可以使用hex檢視哪一塊資料量最多,顏色越深,當前附近值的越多。
#鳶尾花資料集 包含花瓣和花萼之間的關係 花瓣的長度 花瓣的寬度 花萼的長度 花萼的寬度
iris = sns.load_dataset(
"iris"
)sns.pairplot(iris)
#檢視兩兩之間的關係
#對角線是當前變數自身分布的情況,非對角線是不同特徵之間的關係。
Seaborn實現單變數分析
import numpy as np import pandas as pd from scipy import stats,integrate import matplotlib.pyplot as plt import seaborn as sns 繪製直方圖 sns.set color cod...
活躍變數分析
1 定義 對於變數x和程式點p,判斷x在點p上的值是否會在流圖中的某條從點p出發的路徑中使用。如果是,就說x在p上活躍 否則就說x在p上是死的。2 用途 重要用途之一是為基本塊進行儲存器分配。乙個值被計算儲存到乙個暫存器中後,很有可能在基本塊中被使用。如果它在基本塊中是死的,就不必在結尾處儲存這個值...
seaborn 單變數分布 雙變數分布
第七課 資料視覺化 第13節 資料集分布視覺化 1 單變數分布 雙變數分布 import seaborn as sns import numpy as np import matplotlib.pyplot as plt sns.version 0.8.1 單變數分布 核密度估計圖 data1 np...