pandas 相關係數函式corr

2021-09-29 11:34:00 字數 1505 閱讀 9692

a = np.arange(1,

10).reshape(3,

3)data = dataframe(a,index=

["a"

,"b"

,"c"

],columns=

["one"

,"two"

,"three"])

print

(data)

''' one two three

a 1 2 3

b 4 5 6

c 7 8 9

'''#計算第一列和第二列的相關係數

print

(data.one.corr(data.two)

)#1.0

#返回乙個相關係數矩陣

print

(data.corr())

''' one two three

one 1.0 1.0 1.0

two 1.0 1.0 1.0

three 1.0 1.0 1.0

'''#計算第一列和第二列的協方差

print

(data.one.cov(data.two)

)#9.0

#返回乙個協方差矩陣

print

(data.cov())

''' one two three

one 9.0 9.0 9.0

two 9.0 9.0 9.0

three 9.0 9.0 9.0

'''

series.corr(other[

, method, min_periods]

)

用途:

檢查兩個變數之間變化趨勢的方向以及程度,值範圍-1到+1,0表示兩個變數不相關,正值表示正相關,負值表示負相關,值越大相關性越強。

計算積距pearson相關係數,連續性變數才可採用;計算spearman秩相關係數,適合於定序變數或不滿足正態分佈假設的等間隔資料; 計算kendall秩相關係數,適合於定序變數或不滿足正態分佈假設的等間隔資料。

公式可以化簡為:

連續資料,正態分佈,線性關係,用pearson相關係數是最恰當

不滿足連續資料,正態分佈,線性關係,用spearman相關係數是最恰,當兩個定序測量資料之間也用spearman相關係數。

皮爾森相關係數 皮爾森相關係數的計算

在 變數關係大揭秘 一 我們提到了皮爾森相關係數r 先來兩個散點圖,左圖中x和y不相關,右圖中x和y高度正相關,差別在哪?讓我們在左右兩圖各畫乙個 田 字,田 字中心的座標是 x的平均值,y的平均值 比較左右兩圖,我們知道 當散點在a b c d均勻分布,x和y不相關 當a和c的點越多,並且b和d的...

皮爾森相關係數

皮爾森相關係數 pearson correlation coefficient 也稱皮爾森積矩相關係數 pearson product moment correlation coefficient 是一種線性相關係數。皮爾森相關係數是用來反映兩個變數線性相關程度的統計量。相關係數用r表示,其中n為樣...

Pearson 相關係數

1 pearson s r,稱為皮爾遜相關係數 pearson correlation coefficient 用來反映兩個隨機變數之間的線性相關程度。2 pearson是乙個介於 1 和1 之間的值。3 當兩個變數的線性關係增強時,相關係數趨於1或 1 4 當乙個變數增大,另乙個變數也增大時,表明...