SPSS程式設計在Ridit分析中的應用

2021-08-16 02:46:17 字數 3430 閱讀 1884

spss程式設計在ridit分析中的應用

多樣本有序分類資料(或等級資料)我們一般採用非引數檢驗——h檢驗(kruskal-wallis法),但其結論只得出三組或多組間總的有差別,若要知道兩兩間是否有差別,則沒有ridit分析只要一次就能得出兩兩比較結果那麼方便。ridit分析是一種關於等級資料進行對比組與標準組比較的假設檢驗方法,其基本思想是先確定乙個標準組(常用以往積累資料或樣本含量相當大的資料)作為特定總體,求得各等級的r值,標準組平均r值理論上可以證明等於0.5,其它各組與標準組比較,看其可信區間是否與0.5重疊,來判斷組間的統計學顯著性[1],最後得出專業解釋。而ridit分析在spss中卻沒有現成的模組,但我們可以通過程式設計可以方便的實現之,茲介紹下:

1.  建立或呼叫spss資料檔案

某醫生用三種方劑**某**病,療效如表1,問三種方劑的療效有無差別[2]。首先建立表1的1~4列資料檔案,effect:療效(1:無效,2:好轉,3:顯效,4:控制);a:糖衣片頻數;b:黃酮片頻數;c:複方組頻數。

表1 三種方劑療效比較的spss資料檔案(第1~4  列)及編輯後執行的各等級ridit值計算表

療效 糖衣片 黃酮片 

a effect b 

② ① ③ 

1 48 5 

2 184 16 

3 77 18 

4 52 19 

2.spss程式的編制和執行

(1)在資料編輯視窗(data editor),通過通過選單選擇:file→new→syntax,開啟語句編輯視窗(syntax editor);若已經建立程式,可通過open→syntax直接開啟。

(2)在語句編輯視窗,用鍵盤輸入表2的程式。

表2 ridit分析的spss程式(不要輸入行號)

行號  程式  行號  程式

1  create l=csum(a).  17  t-test

2  compute l1=lag(l,1).  18   /testval=0

3  if (effect=1) l1=0.  19   /variables=r

4  compute d=a/2.  20   /criteria=cin (.95) .

5  compute t=l1+d.  21  weight by b .

6  if (effect=4) s=l.  22  t-test

7  sort cases by effect(d).  23   /testval=0

8  loop if (effect<4).  24   /variables=r_b

9  compute s1=lag(s,1).  25   /criteria=cin (.95) .

10  compute s=s1.  26  weight by c .

11  end loop if (effect=1).  27  t-test

12  compute r=t/s.  28   /testval=0

13  sort cases by effect(a).  29   /variables=r_c

14  compute r_b=r.  30   /criteria=cin (.95) .

15  compute r_c=r.  31  execute.

16  weight by a .    

以上程式在語句編輯視窗輸入時,不要輸入行號,程式中的英文本母不分大、小寫。另外該程式也可在word、記事本等其他文字編輯軟體中編輯,然後只要通過複製將程式貼上到syntax editor視窗。

(3)在語句編輯視窗,通過選單選擇:run→all執行程式。

3.結果解釋

以上程式是以糖衣片(a)組作為標準組計算r值,l:累積頻數(為求l1的中間變數);l1:累積頻數下移一行;d:標準組各等級之半;t:為l1欄加上d欄的值;s:標準組的總例數;s1(為求s的中間變數);r:標準組的r值。程式執行後,還可在output視窗中檢視到a、b、c三組的平均r值及95%的可信區間:糖衣片的平均r值為0.5,與理論相符,說明計算正確;黃酮片:平均r值為0.6493,95%ci(0.5758,0.7228);複方片:平均r值為0.5045,95%ci(0.4371,0.5718)。根據可信區間是否與標準組(理論上為0.5)相交來決定各對比組間的顯著性水平,如圖1,糖衣片的r值對應於0.5,複方片95%的可信區間與糖衣片平均r值(理論上為0.5)重疊,所以p>0.05,故複方片與糖衣片之間的療效無統計學顯著性,尚不能認為兩者療效間有統計學差異;而黃酮片可信區間與理論r值0.5不重疊,則p<0.05,故黃酮片與糖衣片之間的療效存在統計學顯著性;同理可知,黃酮片與複方片的可信區間也不重疊,故兩者療效存在統計學差異。

圖2 標準組平均r值、對比組平均r值及95%可信區間

4.程式解釋

第1~3行:計算標準組累計頻數(移下一行)。csum(cumulative sum)為計算標準組的累加和l,lag(variable,ncases)為數值型函式或字元型函式[2],返回資料集中某一變數(variable)的ncases之前的觀測值所屬變數的值,對第1個觀察值來說,將返回缺失值(數值型變數)或空格(字元型變數)[3]。本例實際上是將變數l的值下移一行。

第4行:計算d標準組各頻數之半。

第5行:計算t,即標準組各頻數之半與累計頻數(移下一行)之和。

第6~11行:計算標準組總例數s,其中s1是為了計算s而設定的中間變數,loop和end loop為迴圈語句,必結合使用,可同時控制變數轉換的次數和條件,本例中的第一次迴圈,對effect<4的個例進行變數轉換;第二次迴圈時,對effect<3的個體進行變數變換,直至effect=1,迴圈結束。

第12~15行:產生標準組及a組(變數a_r)和b組(變數b_r)的r值,這三組的r值是一樣,其中a組與b組的r值是為了計算a、b兩組的可信區間作準備。

第16~31行:分組計算糖衣片a(標準組)、黃酮片b及複方組c的95%的可信區間,可在output視窗中檢視。第16、21、26行分別對a、b、c各組的頻數進行加權(weight),第17~20行是呼叫t-test程式計算標準組的平均r值。第22~25行和第27~30行為分別計算黃酮片(b組)及複方組(c組)的平均r值及95%的可信區間。

5.組內不能確定標準組時spss的處理方法 

若標準組數量很大時,可看作總體(如上例把糖衣片看成標準組),不必計算抽樣誤差,將對比組作為樣本進行檢驗。但有時相互比較的各組樣本中往往並無例數很多的組別,如仍將其中一組作為標準組依照上例方法處理是不適當,這時可將各組的等級合併,以其合計數作為各等級的標準分布,計算各等級的ridit值。在以上程式中只要利用compute命令產生乙個新的變數來表示各組的等級合併,如在第1行插入:compute tf(合計頻數)=a+b+c;再將上面的程式作適當的修改,即可算出各組的平均r值。然後用u檢驗公式(兩組時用)或χ2檢驗公式(多組時用)進行假設檢驗[2],u值或χ2值計算可以在transform→compute選單中利用軟體提供的各種函式和表示式來實現,同時也可利用其中的統計函式u值累積分布函式(cdf.norm(u,0,1))或χ2累積分布函式(cdf.chisq(χ2,df))直接返回相應的p值,具體過程不多加詳述。

聚類分析在SPSS中的應用

1 方法概述 聚類分析又稱群分析,它是研究 樣品或指標 分類問題的一種多元統計方法,所謂類,通俗地說,就是指相似元素的集合。2 根據分類物件的不同聚類分析可以分為 樣品聚類 又稱q型聚類 就是對事件進行聚類,或是說對觀測量進行聚類,是根據被觀測的物件的各種特徵即反映被觀測物件的特徵的各變數值進行分類...

SPSS在航空業中的應用

13.1 研究背景及意義 民航業作為科技型新興產業,在我國眾多行業中占有重要以及特殊的地位.伴隨著整個國民經濟的發展而不斷發展壯大,民航產業作為國民經濟的重要行業,同時作為民用相對先進方便的交通運輸方式,是我國運輸行業中必不可少的一部分,它的發展程度深刻反映了乙個國家的經濟水平,也對我國 和旅遊業有...

SPSS在電力行業中的應用

8.1 研究背景及意義 電力工業是我國國民經濟的重要基礎,隨著人民生活水平的提高和產業結構的改善,對電力的需求正在逐年增加,同時對電力質量的要求也越來越高,而且因為電能生產和消費的同時性的存在,對電網建設和布局提出了更高的要求。電力系統負荷 是電力部門進行系統的規劃設計與計畫管理工作的乙個重要的基礎...