在統計學中,當同時考慮一系列的統計推斷或者基於觀察值選擇的引數的子集時會發生多重比較的問題(multiple comparisons problem)。
原因:當乙個人把子集作為整體的估計時,錯誤的推斷很可能發生,包括置信區間沒有包含相應的總體引數或者是假設檢驗錯誤地拒絕了零假設。對此,我舉出兩個例子作為說明。
①假設我們想要去判斷乙個寫作教學的新方法與傳統方法的好壞。那麼我們把學生分為兩組,一組使用新方法(**組),一組使用傳統方法(對照組)。我們可以根據學生們的語法、拼寫、內容等來評估這兩組的表現,但是隨著評估引數的增多,由於隨機因素,這兩組會至少在乙個引數上表現得不同,那麼此時我們怎麼判斷這種不同時隨機的表現還是使用方法所致的呢?
②經典的拋硬幣的問題:乙個均勻的硬幣(即正反兩面概率相等)拋10次至少有9次正面的概率是(10+1)*0.5^10 =0.0107, 這個概率低於0.05,所以我們一般可以推定一次拋硬幣的實驗中這種情況是不會發生的,反之,如果一次實驗中發生了這種小概率的事件,可以宣稱這個硬幣是不均勻的。現在,假設我們有100個均勻的硬幣,把它們同時做上訴的實驗,不會發生乙個硬幣拋10次至少9次正面的概率是(1-0.0107)^100=0.34。由此,我們很可能錯誤地推斷至少有乙個硬幣是不均勻的。所以單個硬幣的評判標準對多個硬幣是不適用的。
解決方法:為了解決上訴的問題,可以使用錯誤發現率(fdr:false discovery rate)、bonferroni correction等方法。
注:通過維基百科歸納整理
多重比較和多重比較陷阱
方差分析中的多重比較 1.當拒絕原假設時,表明 i i 1,2,k 之間的差異是顯著的,但 1與 2 1與 3 1與 k k 1與 k之間究竟是哪兩個均值不同呢?這就需要做進一步的分析,所使用的方法就是多重比較方法 例如最小顯著差異方法 它是通過對總體均值之間的配對比較來進步檢驗到底哪些均值之間存在...
notes spm多重比較校正
spm做完統計後,statistical table中的fdrc實際上是在該p uncorrected下,可以令fdr correcred p 0.05的最小cluster中的voxel數目 topological fdr和alphasim的步驟完全相同,只是兩者在估計cluster大小的時候所用演...
t檢驗orF檢驗and多重比較
t檢驗,亦稱student t檢驗 student s t test 主要用於樣本含量較小 例如n 30 總體標準差 未知的正態分佈。t檢驗是用t分布理論來推論差異發生的概率,從而比較兩個平均數的差異是否顯著。用到t檢驗的場景 1.單個樣本平均數的假設測驗 1.比較成組資料的平均數 2.比較成對資料...