#**氣象家園#
相關係數的檢驗主要有兩種方法,一種是對假設 「相關係數ρ=0」 的t檢驗,另一種是對假設 「相關係數ρ≠0」的z檢驗。
關於t檢驗(檢驗r是否顯著,即檢驗r是否不等於零)
1 根據r和n計算得到t
2 查表得到 在 顯著性水平α和自由度(n-2)下,t分布的上α分位點tα/2
3 判斷t>tα/2是否成立,若成立,則r是顯著的
關於z檢驗
此法目的如下,假設相關係數等於ρ,經過一系列步驟,計算出該假設在顯著性水平α下為真的置信區間(通俗的講,就是計算得到乙個範圍(rlow,rhi),如果要檢驗的相關係數落在這個範圍內(rlow
hi),那麼原來的假設(相關係數=ρ)有(1-α)的把握成立)。
1 計算r對應的z統計量zr (fisher變換)
2 計算ρ對應的z統計量zρ (fisher變換)
3 計算zr和zρ的差 |zr-zρ|,標準誤se=1/sqrt(n-3)
4 查表得到 給定顯著性水平α下,標準正態分佈的上α分位點zα/2
5 判斷|zr-zρ|/sqrt(n-3)>zα/2是否成立,若成立,則原假設有(1-α)的把握成立
z檢驗的變體
1計算z統計量 (r->z, fisher變換) : z=0.5*ln((1+r)/(1-r))
2查表找到顯著水平α下,標準正態分佈的上α分位點zα/2
3z統計量的標準差σ=1/sqrt(n-3)
4z的下限和上限 z-(zα/2)*σ, z+(zα/2)*σ
5用fisher逆變換(r=(exp(2*z)-1)/(exp(2*z)+1))得到r的下限和上限。
參考資料
相關係數顯著性檢驗的臨界值r
另外,關於相關係數顯著性檢驗的臨界值r的計算,我以前存在了誤區:計算t統計量時用的這個公式:t=r*sqrt(n-2/(1-r2)),我誤以為可以通過此公式從t的臨界值反推得到r的臨界值。但是計算出的r值始終和書上的不一樣。今天終於發現了問題所在,相關係數的臨界值不能使用這種方法計算。正確的計算方法如下(參考
1 計算總平方和sst、回歸平方和ssr和殘差平方和sse
1 計算f統計量 f=(n-k-1)/k*((ssr)/(sst-ssr)) 注:在兩個樣本的相關係數的情況下,k=1
2 計算r的臨界值 r=sqrt(k*f/(k*f+n-k-1))
皮爾森相關係數 皮爾森相關係數的計算
在 變數關係大揭秘 一 我們提到了皮爾森相關係數r 先來兩個散點圖,左圖中x和y不相關,右圖中x和y高度正相關,差別在哪?讓我們在左右兩圖各畫乙個 田 字,田 字中心的座標是 x的平均值,y的平均值 比較左右兩圖,我們知道 當散點在a b c d均勻分布,x和y不相關 當a和c的點越多,並且b和d的...
皮爾遜相關係數和檢驗P值
看兩者是否算相關要看兩方面 顯著水平以及相關係數 1 顯著水平,就是p值,這是首要的,因為如果不顯著,相關係數再高也沒用,可能只是因為偶然因素引起的,那麼多少才算顯著,一般p值小於0.05就是顯著了 如果小於0.01就更顯著 例如p值 0.001,就是很高的顯著水平了,只要顯著,就可以下結論說 拒絕...
斯皮爾曼相關係數範圍 資料的相關係數
兩個變數之間的皮爾遜相關係數定義為兩個變數之間的協方差和標準差的商 從式子 1 能看到,pearson 係數的取值範圍在 1 1之間,其中1是總正線性相關性,0是非線性相關性,並且 1是總負線性相關性。pearson相關係數的乙個關鍵數學特性是它在兩個變數的位置和尺度的單獨變化下是不變的。也就是說,...