協方差矩陣

2022-08-19 22:21:11 字數 1460 閱讀 3097

一、有n個樣本的集合: x =

均值:

標準差:

方差:

有兩個資料集,資料集1,x = [0,8,12,20];資料集2,y = [8,9,11,12]。兩者的均值一樣都為10。資料集1的標準差8.3,資料集2的標準差為1.8,因為後者的資料分布比較集中,標準差描述的是這種散布度。之所以除以n-1而不是n,是因為這樣使我們以較小的樣本集更好的逼近總體的標準差,即統計上的無偏估計。方差是標準差的平方。

二、為什麼需要協方差

1、標準差和方差一般是用來描述一維資料的,但現實生活中遇到的通常是含有多維資料的資料集,最簡單的是大家上學時要統計多個學科的考試成績。另外,我們想要知道兩件事之間的關聯程度,例如,乙個男孩子的猥瑣成都和他受女孩子歡迎程度是否存在聯絡。協方差就是解決這樣乙個問題,度量兩個隨機變數關係的統計量。

仿照方差的定義,度量各個維度偏離其均值的程度

協方差定義為

協方差結果的意義?如果結果為正值,說明兩者是正相關,也就是說:乙個人越猥瑣越受女孩子歡迎。如果結果為負值,說明兩者是負相關,說明女孩喜歡正經的人(不太可能)。如果為0,說明兩者沒有關係,相互獨立。

2、上述是兩件事的關聯程度,如果是三件事就需要用矩陣表示了,這就是協方差矩陣。

3、協方差的計算

3.1

兩個資料集a和b的組成的矩陣x為

其協方差矩陣正好與矩陣(x*x的轉置)/m相等,如圖所示

3.2如果是三個資料集a、b、c組成的矩陣y為

同理驗證

同理可以推廣到更高維空間,所以可以直接使用資料集組成的矩陣計算協方差矩陣,即

協方差 協方差矩陣

期望 離散型隨機變數的一切可能的取值xi與對應的概率pi xi 之積的和稱為該離散型隨機變數的數學期望 設級數絕對收斂 記為 e x 隨機變數最基本的數學特徵之一。它反映隨機變數平均取值的大小。又稱期望或均值。求法 設離散型隨機變數x的取值為 方差 方差是各個資料與平均數之差的平方的平均數。在概率論...

期望 方差 協方差 協方差矩陣

方差pearson相關係數 協方差矩陣與相關係數矩陣 我們將隨機實驗e的一切可能基本結果 或實驗過程如取法或分配法 組成的集合稱為e的樣本空間,記為s。樣本空間的元素,即e的每乙個可能的結果,稱為樣本點。這樣思考一下,如果某個資料集x xx滿足它是某個分布的隨機取樣,那麼在取樣過程中最可能出現的值是...

協方差和協方差矩陣

協方差的定義 對於一般的分布,直接代入e x 之類的就可以計算出來了,但真給你乙個具體數值的分布,要計算協方差矩陣,根據這個公式來計算,還真不容易反應過來。網上值得參考的資料也不多,這裡用乙個例子說明協方差矩陣是怎麼計算出來的吧。記住,x y是乙個列向量,它表示了每種情況下每個樣本可能出現的數。比如...