調整秩和檢驗 ( aligned ranks test ) ,也稱為 hodges-lehmmann 檢驗,簡記為 hl 檢驗。
當隨機完全區組設計的區組數較大或處理組數較小是,friedman 檢驗的效果就不是很好了,因為 friedman 檢驗的編秩是在每乙個區組內進行的,這種編秩的方法僅限於區組內的效應,所以不同區組間相應的直接比較是無意義的( friedman 檢驗具體應用方法見筆者另一篇部落格
因此就可以採用 hl 檢驗,為了去除區組效應,可以用區組的平均值或中位數作為區組效應的估計值,然後每個觀測值與估計值相減來反映處理之間的差異,由此就可能消除區組之間的差異,將問題歸為無區組的情況來處理。
現研究一種高血壓患者的血壓控制**的效果,經驗表明**效果與病人本身的肥胖和身高型別有關。現將高血壓病人按控制方法分為四類:a,b,c,d。從這四類病人中隨機抽取8名病人做完全區組設計試驗,進行一段時間的高血壓控制**後,測量血壓指數(經過一定變化後)如下表所示:
處理區組1
區組2區組3
區組4區組5
區組6區組7
區組8a
23.1
57.6
10.5
23.6
11.9
54.6
21.0
20.3
b22.7
53.2
9.719.6
13.8
47.1
13.6
23.6
c22.5
53.7
10.8
21.1
13.7
39.2
13.7
16.3
d22.6
53.1
8.321.6
13.3
37.0
14.8
14.8
試問這4種血壓控制對四種病人降壓效果是否相同?顯著性水平為0.05。
解答:先用 friedman 檢驗,
import scipy.stats as statsa=[
23.1
,57.6
,10.5
,23.6
,11.9
,54.6
,21.0
,20.3]b=
[22.7
,53.2
,9.7
,19.6
,13.8
,47.1
,13.6
,23.6]c=
[22.5
,53.7
,10.8
,21.1
,13.7
,39.2
,13.7
,16.3]d=
[22.6
,53.1
,8.3
,21.6
,13.3
,37.0
,14.8
,14.8
]stats.friedmanchisquare(a,b,c,d)
結果如下:
friedmanchisquareresult ( statistic = 6.449999999999989, pvalue = 0.09165537466946727 )
由於p值大於0.05,故認為降壓效果沒有顯著差異。
但是從原始資料表中可以看出,區組間的差異是顯然的,於是使用 hl 檢驗如下:
defhl(
*list_tuple)
: k=
len(list_tuple)
b=len(list_tuple[0]
) data_ar=np.array(list_tuple)
rank_ar=stats.rankdata(data_ar-np.mean(data_ar,axis=0)
).reshape(k,b)
q=(k-1)*
(np.
sum(rank_ar.
sum(axis=1)
**2)-k*b**2*
(k*b+1)
**2/4
)/(np.
sum(rank_ar**2)
-np.
sum(rank_ar.
sum(axis=0)
**2)/k)
sig=stats.chi2.sf(q,k-1)
return
hl(a,b,c,d)
結果如下:
由於p值小於0.05,故認為對不同的病人採取不同的高血壓處理,會產生不同的降壓效果。
這個結果與直觀想象是吻合的,也表明 friedman 檢驗與 hl 檢驗是有著顯著不同的。
非引數統計的Python實現 符號檢驗
符號檢驗 sign test 是非引數統計中最古老的檢驗方法之一,僅通過符號 和 的個數來檢驗分位數。現有28位學生某門課程的成績資料,為 95 89 68 90 88 60 81 67 60 60 60 63 60 92 60 88 88 87 60 73 60 97 91 60 83 87 81...
非引數統計的Python實現 隨機遊程檢驗
隨機遊程檢驗是檢驗乙個序列中的資料出現是否與順序無關的一種方法。值得注意的是,隨機遊程檢驗的零假設是資料出現順序隨機,備擇假設是資料出現順序不隨機。在試驗設計中,經常要關心試驗誤差 experiment error 是否與序號無關。假設有 a,b,c 三個葡萄品種,用完全試驗設計需要重複測量4次,安...
非引數統計
非引數統計 nonparametric statistics 隱藏 編輯 非引數統計是統計學的乙個重要分支,它在實踐中有著廣泛的應用。所謂統計推斷,就是由樣本觀察值去了解總體,它是統計學的基本任務之一。若根據經驗或某種理論我們能在推斷之前就對總體作一些假設,則這些假設無疑有助於提高統計推斷的效率。這...