一:背景
這幾天重新複習了一下以前經典的假設檢驗方法。包括之前使用excel來做一些簡單的統計分析。
假設檢驗(hypothesis test)亦稱顯著性檢驗(significant test),是統計推斷的另一重要內容,
其目的是比較總體引數之間有無差別。假設檢驗的實質是判斷觀察到的「差別」是由抽樣誤差引起還是總體上的不同,
目的是評價兩種不同處理引起效應不同的證據有多強,這種證據的強度用概率p來度量和表示。
p值就是當原假設為真時所得到的樣本觀察結果或更極端結果出現的概率。
二:假設檢驗步驟
假設任意給定兩組資料,比如從兩個樣本抽樣的乙個特徵。
想知道這兩個樣本的分布是否不同,有沒有差別。
問題通常有兩種解法,乙個是引數檢驗,乙個非引數檢驗。
如果資料的分布比較符合某些正態分佈或經典三大分布(t分布,f分布,卡方分布)的條件,採用第一種辦法效果比較好,分為以下幾個步驟
1.建立假設
2.求抽樣分布
3.選擇顯著性水平和否定域
4.計算檢驗統計量
5.判定
正態分佈,用以構建z統計量,主要用來作為以下幾種情形的檢驗分布,
1:(單個總體引數)當總體方差已知,大樣本的情況下,判斷樣本均值(比例)和總體均值(比例)是否有差異。例如已知乙個城市2023年人均收入是1萬元,2023年隨機抽樣了100個人,計算均值為10100元,問兩年的人均收入是否有顯著差異。
2:(單個總體引數)當總體方差已知,小樣本的情況下,判斷樣本均值(比例)和總體均值(比例)是否有差異。
3:(兩個總體引數)當總體方差已知或未知,大樣本的情況下,比如隨機抽100名18歲高中生,比較男女的身高是否有差異
t分布,用以構建t統計量,又稱厚尾分布
1:(單個總體引數)當總體方差未知,小樣本的情況下,判斷樣本均值(比例)和總體均值(比例)是否有差異。
2:(兩個總體引數)當總體方差未知,小樣本的情況下,比如隨機抽20名18歲高中生,比較男女的身高是否有差異
卡方分布,用以構建x2統計量,
1:(單個總體引數)比較和總體方差是否存在差異,比如生產一種零件,要求誤差不超過1mm,隨機抽取了20個,分別進行測定,求卡方值做檢驗
3:獨立性檢驗,兩個分類變數之間是否存在聯絡,比如產品的質量與產地是否有關
f分布,用以構建f統計量
1:(兩個總體引數)比較兩總體的方差是否相等,方差齊,可以通過兩個方差之比等於1來進行,
如果不滿足正態,獨立,方差齊等前提,也不知道分布形式,可以採用非參檢驗。
當然滿足引數檢驗條件的兩組資料也可以使用非參檢驗,但是效果不如引數檢驗好。
三:引數檢驗方法示例
1:t檢驗
通過兩個樣本之差的分布去推斷,兩個樣本資料應滿足正態分佈條件,方差齊,還要相互獨立,之所以叫t檢驗,是因為構建的統計量是t統計量,t統計量服從n1+n2-2個自由度的t分布,
小樣本的情況下(n<=30),比較兩個樣本的均值是否顯著差異。
原假設是沒有差異,p<0.05,拒絕原假設,說明有差異。如果通過levene f方法檢驗方差不齊,則需要用校正的t檢驗,或者用非引數方法處理。
excel (ttest),spss,r (t.test())都可以分析。
前提要先做正態性檢驗,但這乙個問題可以有很多方法來處理,乙個是畫直方圖,pp,qq,只是定性分析,還有其他的方法,像r裡的shapiro.test,ks檢驗用的比較多。
補充說明:
levene's test 檢驗,用於檢驗兩組及兩組以上獨立樣本的方差是否相等。要求樣本為隨機樣本且相互獨立。
levene檢驗 與bartlette檢驗(巴特萊多)的區別:
1)對於正態分佈的樣本,bartlette檢驗極其靈敏,但是對於非正態分佈的樣本,檢驗非常不準確;
2)levene檢驗是一種更為穩健的檢驗方法,既可用於正態分佈的樣本,也可用於非正態分佈的樣本,同時對比較的各組樣本量可以相等或不等;
3)兩者的檢驗原理不同,bartlette檢驗是對原始資料檢驗其方差是否齊性,而levene檢驗是檢驗組間殘差是否齊性,而且一般認為要求殘差的方差齊性,
所以一般統計軟體使用levene檢驗(同時,根據由原理也可以解釋1和2,levene檢驗只針對殘差,所以與分布無關,而bartlette檢驗針對原始資料,所以符合正態分佈與非正態分佈差別較大);
因此,levene檢驗被廣泛地公認為是標準的方差齊性檢驗的方法。
2:方差分析(f 檢驗)
t檢驗是用來比較樣本均值的,f檢驗是用來比叫方差的,又分單因素,雙因素,多因素,就是對一種目標,有乙個變數或多個變數影響這該目標,比如畝產,有品種,肥力,灌溉等因素,哪個因素是主要影響因素呢?
使用方差分析需要滿足(正態,方差齊)
通過方差分析,找到整體方差的主要**,加入有3個因素,一般軟體會自動處理單因素,雙因素聯合效應,三因素聯合效應。
原假設是組間方差(同因素不同處理水平下)沒差異,如果p<0.05,拒絕原假設,說明該因素的方差佔了大部分整體方差**,是顯著影響因素。
如果乙個因素種,有多個處理水平,也就是多重比較時,spss裡使用tukey和lsd這兩種比較檢驗方法較為常用,如果方差不齊,有tamhane』s t2法選項處理。
3:卡方檢驗
用於列聯表分析,當變數是乙個分類變數時,統計的是頻數,比如贊同的人數,一級,二級這種。
卡方檢驗可以用於正態性檢驗,獨立性檢驗(比如說牛奶的質量是否與產地有關), 比較分類變數比例之間是否有顯著差異(比如兩個城市之間不同社會階層的收入水平佔比是否有差異)。
自由度是(r-1)*(c-1)
四:非引數檢驗方法示例
如果將資料取對數,或者開根號等處理後仍然不滿足正態分佈的前提條件,可以採用非引數的方法分析,可以參考這個link:
非引數檢驗主要不是用變數的值,二是用秩作為分析物件。
spss只要勾上四個選項,可以同時分析出結果。
1: u檢驗
要滿足四個假設,1.資料中有乙個因變數,且因變數為連續變數或等級變數。
例如:連續變數——智力得分、考試分數、體重;等級變數——滿意程度(包括非常不滿意、不滿意、滿意、非常滿意)。
2.資料中有乙個自變數,且自變數為二分類的獨立變數。例如:性別分組——男性組、女性組;生活習慣——吸菸組、非吸菸組。
3.觀察值之間相互獨立,即自變數的兩個分組中的研究個體不能相關。
研究資料不符合此項條件,例如測量同一組患者**前與**後的血生化指標,這樣資料屬於配對樣本資料,應選用wilcoxon符號秩和檢驗。
例如:對比兩個班級的學生的考試分數;對比患者與健康者的血生化指標。
4.自變數中兩組樣本的分布一致。
2:ks檢驗:不僅可以檢驗單個總體是否服從某一理論分布,還能檢驗兩個總體分布是否存在顯著差異。
3:moses極端反應檢驗
4:w檢驗
統計學的假設檢驗
假設檢驗是一種規則,它根據資料樣本所提供的證據,指定是肯定還是否定有關總體的宣告。基本原理是先對總體的特徵作出某種假設,然後通過抽樣研究的統計推理,對此假設應該被拒絕還是接受作出推斷。假設檢驗的基本思想是小概率反證法思想。小概率思想是指小概率事件 p 0.01或p 0.05 在一次試驗中基本上不會發...
統計學的假設檢驗
上次寫了統計學裡面的置信度與置信區間以後,文章反響還不錯,這次再來試著寫寫統計學裡面的假設檢驗。假設檢驗的核心其實就是反證法。反證法是數學中的乙個概念,就是你要證明乙個結論是正確的,那麼先假設這個結論是錯誤的,然後以這個結論是錯誤的為前提條件進行推理,推理出來的結果與假設條件矛盾,這個時候就說明這個...
統計學假設檢驗的兩類錯誤
我們之前 了假設檢驗的基本思想,現在我們來介紹下兩類錯誤。假設檢驗的最終目的是 去偽存真,那麼它對應的兩類錯誤就是棄真存偽。接受或拒絕h0,都可能犯錯誤i類錯誤 棄真錯誤,發生的概率為 ii類錯誤 取偽錯誤,發生的概率為 為了更形象點說明這兩類錯誤,我們看下下面這個 對於正常情況下對於上面例項的假設...