a = np.arange(1,
10).reshape(3,
3)data = dataframe(a,index=
["a"
,"b"
,"c"
],columns=
["one"
,"two"
,"three"])
print
(data)
''' one two three
a 1 2 3
b 4 5 6
c 7 8 9
'''#計算第一列和第二列的相關係數
print
(data.one.corr(data.two)
)#1.0
#返回乙個相關係數矩陣
print
(data.corr())
''' one two three
one 1.0 1.0 1.0
two 1.0 1.0 1.0
three 1.0 1.0 1.0
'''#計算第一列和第二列的協方差
print
(data.one.cov(data.two)
)#9.0
#返回乙個協方差矩陣
print
(data.cov())
''' one two three
one 9.0 9.0 9.0
two 9.0 9.0 9.0
three 9.0 9.0 9.0
'''
series.corr(other[
, method, min_periods]
)
用途:
檢查兩個變數之間變化趨勢的方向以及程度,值範圍-1到+1,0表示兩個變數不相關,正值表示正相關,負值表示負相關,值越大相關性越強。
計算積距pearson相關係數,連續性變數才可採用;計算spearman秩相關係數,適合於定序變數或不滿足正態分佈假設的等間隔資料; 計算kendall秩相關係數,適合於定序變數或不滿足正態分佈假設的等間隔資料。
公式可以化簡為:
連續資料,正態分佈,線性關係,用pearson相關係數是最恰當
不滿足連續資料,正態分佈,線性關係,用spearman相關係數是最恰,當兩個定序測量資料之間也用spearman相關係數。
皮爾森相關係數 皮爾森相關係數的計算
在 變數關係大揭秘 一 我們提到了皮爾森相關係數r 先來兩個散點圖,左圖中x和y不相關,右圖中x和y高度正相關,差別在哪?讓我們在左右兩圖各畫乙個 田 字,田 字中心的座標是 x的平均值,y的平均值 比較左右兩圖,我們知道 當散點在a b c d均勻分布,x和y不相關 當a和c的點越多,並且b和d的...
皮爾森相關係數
皮爾森相關係數 pearson correlation coefficient 也稱皮爾森積矩相關係數 pearson product moment correlation coefficient 是一種線性相關係數。皮爾森相關係數是用來反映兩個變數線性相關程度的統計量。相關係數用r表示,其中n為樣...
Pearson 相關係數
1 pearson s r,稱為皮爾遜相關係數 pearson correlation coefficient 用來反映兩個隨機變數之間的線性相關程度。2 pearson是乙個介於 1 和1 之間的值。3 當兩個變數的線性關係增強時,相關係數趨於1或 1 4 當乙個變數增大,另乙個變數也增大時,表明...