如果結果為正值,則說明兩者是正相關的,也就是說乙個人身高越高體重越重。雖然協方差能反映兩個隨機變數的相關程度(協方差大於0的時候表示兩者正相關,小於0的時候表示兩者負相關),但是協方差值的大小並不能很好地度量兩個隨機變數的關聯程度,例如,現在二維空間中分布著一些資料,我們想知道資料點座標x軸和y軸的相關程度,如果x與y的相關程度較小但是資料分布的比較離散,這樣會導致求出的協方差值較大,用這個值來度量相關程度是不合理的。如果結果為負值, 就說明兩者是負相關。
如果為0,則兩者之間沒有關係,身高和體重之間沒有關聯。
為了更好的度量兩個隨機變數的相關程度,引入了pearson相關係數,其在協方差除以兩個變數的標準差。pearson是乙個介於-1和1之間的值,當兩個變數的線性關係增強時,相關係數趨於1或-1;
當相關係數為0時,x和y兩變數無關係。下圖描述pearson相關係數從-1到1的影象。當x的值增大(減小),y值增大(減小),兩個變數為正相關,相關係數在0.00與1.00之間。
當x的值增大(減小),y值減小(增大),兩個變數為負相關,相關係數在-1.00與0.00之間。
皮爾遜相關係數
皮爾遜相關係數是比歐幾里德距離更加複雜的可以判斷人們興趣的相似度的一種方法。該相關係數是判斷兩組資料與某一直線擬合程式的一種試題。它在資料不是很規範的時候,會傾向於給出更好的結果。公式一 皮爾遜相關係數計算公式 公式二 皮爾遜相關係數計算公式 公式三 皮爾遜相關係數計算公式 公式四 皮爾遜相關係數計...
皮爾遜相關係數與p值
假設有兩個變數x,y 則兩者之間的皮爾遜相關係數為 皮爾遜相關係數衡量的是兩者之間的相關關係,取值範圍為 1,1 取值為正表示正相關,取值為負表示是負相關,同時,皮爾遜相關係數衡量的是兩個變數之間的線性關係,如下圖,橫軸與縱軸變數有明顯的線性關係,由公式計算出來相關係數為 0.9836,高度相關性 ...
從向量的角度理解皮爾遜相關係數
高中數學學的向量中有乙個重要的公式用於計算兩個向量之間的夾角 在笛卡爾座標系中有向量 x1,y1 和 x2,y2 他們間夾角的cos值等於 向量內積 除以 兩個向量摸的乘積。如果你仔細比較一下 求向量夾角的公式和皮爾遜公式,你會發現他們之間很相似!但還是有點不一樣。是的,實際上來說,皮爾遜公式 和 ...