之前對於協方差一直不是非常理解,今天在做資料探勘作業的時候又再次看到了協方差,所以就想著今天搞懂他。
當然,還是要請教李彥巨集大師。
通過下文兩篇文章,算是對協方差有了乙個初步的,比較形象的了解了。
**協方差矩陣
協方差的意義
我們描述乙個一維的資料,可以用數學期望值e(x)來表示資料的平均值,也可以用乙個方差d(x)來表示資料的離散程度。
但如果涉及到二維的資料,我們如何描述它的離散程度呢?
當然,我們可以分別的對每一維資料進行方差計算,但是這樣得出來的只是每一維資料的離散程度,能不能得到乙個描述這兩維之間的關係的資料呢?
當然可以,這就是協方差的由來了。
類似方差的計算公式,協方差的公式是通過對兩維的向量的對應項求他們與各自均值之差的積(可能有點繞口,但是公式在鏈結中有了),在對每一項的積進行求和,來表示這兩維向量之間的關係的。
如果得到的結果為正,則表示他們之間同增同減,即正相關;如果得到的結果為負,那麼表示他們之間增減各異,為負相關; 而如果得到的結果為0,表明他們之間其中一維的增減對另一維資料沒有影響,不相關。
以上是二維資料的協方差。那如果要表示多維資料的呢?對了,就是通過對每兩維資料進行協方差的計算來表示(為什麼我一開始想到的是對這多維資料的對應項求其與各自均值之差的積的和。。。)。那麼就很自然的要用乙個矩陣的形式來表示了。每乙個項的橫座標與縱座標對應要求的兩維的協方差。(很懶,也不放圖了)。而矩陣的對角線上的元素就是對應的橫座標(或者縱座標)對應的向量的方差了。
(話說怎麼插入公式啊,自己手打公式好難看。。。完)xi
−x¯發生發生
協方差
如何理解協方差
看原文 怎樣將這3種相關情況,用乙個簡單的數字表達出來呢?在圖中的區域 1 中,有 x ex y ey 0 所以 x ex y ey 0 在圖中的區域 2 中,有 x0 所以 x ex y ey 0 在圖中的區域 3 中,有 x0 在圖中的區域 4 中,有 x ex y ey 0 所以 x ex y...
協方差 協方差矩陣
期望 離散型隨機變數的一切可能的取值xi與對應的概率pi xi 之積的和稱為該離散型隨機變數的數學期望 設級數絕對收斂 記為 e x 隨機變數最基本的數學特徵之一。它反映隨機變數平均取值的大小。又稱期望或均值。求法 設離散型隨機變數x的取值為 方差 方差是各個資料與平均數之差的平方的平均數。在概率論...
期望 方差 協方差 協方差矩陣
方差pearson相關係數 協方差矩陣與相關係數矩陣 我們將隨機實驗e的一切可能基本結果 或實驗過程如取法或分配法 組成的集合稱為e的樣本空間,記為s。樣本空間的元素,即e的每乙個可能的結果,稱為樣本點。這樣思考一下,如果某個資料集x xx滿足它是某個分布的隨機取樣,那麼在取樣過程中最可能出現的值是...