方差與協方差

2021-12-30 12:12:02 字數 1739 閱讀 8734

方差(variance)是度量一組資料分散的程度。

方差是各個樣本與樣本均值的差的平方和的均值:

var(x)=∑ni=1(xi?xˉ)2n?1

numpy裡面有var方法可以直接計算方差,ddof引數是貝塞爾(無偏估計)校正係數(bessel』s correction),設定為1,可得樣本方差無偏估計量。

print(np.var([6,8,10,14,18],ddof=0)) #除以n,表示資料集的方差,ddof預設值為0

18.56

#在高斯分布中,我們抽取一部分的樣本,用樣本的方差表示滿足高斯分布的大樣本資料集的方差。由於樣本主要是落在x=u中心值附近,那麼樣本的如果用除以n算方差,那麼**方差一定小於大資料集的方差(因為高斯分布的邊沿抽取的資料很少)。為了能彌補這方面的缺陷,那麼我們把公式的n改為n-1,以此來提高方差的數值。這種方法叫做貝塞爾校正係數。

print(np.var([6,8,10,14,18],ddof=1)) #除以n-1,表示樣本的方差

23.2

print(np.var([6,8,10,14,18],ddof=2)) #除以n-2

30.9333333333協方差(convariance)是度量兩個變數的變動的同步程度,也就是度量兩個變數尼亞性相度程度。

cov(x,y)=∑ni=1(xi?xˉ)(xi?yˉ)n?1

numpy裡面的cov方法可以計算協方差矩陣,取協方差矩陣的[0][1]值即為協方差。

print(np.cov([6,8,10,14,18],[7,9,13,17.5,18]))

[[ 23.2 22.65]

[ 22.65 24.3 ]]

print(np.cov([6,8,10,14,18],[7,9,13,17.5,18])[0][1])

22.65

#cov方法同樣有ddof引數,但與var不同,其ddof預設值為1

print(np.cov([6,8,10,14,18],[7,9,13,17.5,18],ddof=0)[0][1])

18.12

print(np.cov([6,8,10,14,18],[7,9,13,17.5,18],ddof=1)[0][1])

22.65相關係數(correlation coefficient)是用以反映變數之間相關關係密切程度的統計指標。相關係數是按積差方法計算,同樣以兩變數與各自平均值的離差為基礎,通過兩個離差相乘來反映兩變數之間相關程度

r(x,y)=cov(x,y)var(x)var(y)√

r(x,y)=n∑xy?∑x∑yn∑x2?(∑x)2√n∑y2?(∑y)2√

使用np.corrcoef(a)可計算行與行之間的相關係數,np.corrcoef(a,rowvar=0)用於計算各列之間的相關係數,輸出為相關係數矩陣。

print(np.corrcoef([6,8,10,14,18],[7,9,13,17.5,18]))[0][1]

[[ 1. 0.95394004]

[ 0.95394004 1. ]]

print(np.corrcoef([6,8,10,14,18],[7,9,13,17.5,18])[0][1])

0.95394003817

x = [6,8,10,14,18]

y = [7,9,13,17.5,18]

print(np.cov(x,y)[0][1]/np.sqrt(np.var(x,ddof=1)*np.var(y,ddof=1)))

0.95394003817

方差與協方差

方差是實際值與期望值 均值 之差平方的平均值,衡量的是一組資料對於其期望值的離散程度。d x k 1 xk e x 2pk 其中e x 是x的期望值,p pk,k 1,2 是x的分布律。d x x e x 2 f x dx其中f x 是x的概率密度。由數學期望的性質展開,上面兩式都可得到 d x e...

期望 方差 協方差 協方差矩陣

方差pearson相關係數 協方差矩陣與相關係數矩陣 我們將隨機實驗e的一切可能基本結果 或實驗過程如取法或分配法 組成的集合稱為e的樣本空間,記為s。樣本空間的元素,即e的每乙個可能的結果,稱為樣本點。這樣思考一下,如果某個資料集x xx滿足它是某個分布的隨機取樣,那麼在取樣過程中最可能出現的值是...

詳解協方差與協方差矩陣

協方差的定義 對於一般的分布,直接代入 e x 之類的就可以計算出來了,但真給你乙個具體數值的分布,要計算協方差矩陣,根據這個公式來計算,還真不容易反應過來。網上值得參考的資料也不多,這裡用乙個例子說明協方差矩陣是怎麼計算出來的吧。記住,x y 是乙個列向量,它表示了每種情況下每個樣本可能出現的數。...