統計學假設檢驗的兩類錯誤

2021-08-22 10:09:49 字數 2703 閱讀 8925

我們之前**了假設檢驗的基本思想,現在我們來介紹下兩類錯誤。

假設檢驗的最終目的是:去偽存真

那麼它對應的兩類錯誤就是棄真存偽。

接受或拒絕h0,都可能犯錯誤i類錯誤

——棄真錯誤,發生的概率為α

ii類錯誤

——取偽錯誤,發生的概率為

為了更形象點說明這兩類錯誤,我們看下下面這個:

對於正常情況下對於上面例項的假設檢驗應該為:

h0:沒有懷孕(原假設為沒有確鑿證據一般不推翻的假設,因為正常人我們認為是沒有懷孕的)

h1:懷孕了

上圖左邊:第一類錯誤為棄真錯誤,也就是原假設為沒有懷孕,但是檢驗的結果落在拒絕域,因而拒絕沒有懷孕的原假設,認定圖一裡的男士懷孕了,而事實上圖裡面的男士根本沒有懷孕,這就犯了第一類錯誤,棄真

上圖右邊:第一類錯誤為存偽錯誤,也就是原假設沒有懷孕,檢驗結果落在接受域,所以接受沒有懷孕的原假設,認定圖一的女士沒有懷孕,而事實上裡的女士是懷孕的,這就犯了第二類錯誤,存偽

我們通過乙個例子來看一下:

解(1)

α錯誤概率計算:由實際推斷原理引起的,即「小概率事件不會發生」的假定所引起的,所以有理由將所有小概率事件發生的概率之和或者即顯著性水平(α=0.05

)看作α

錯誤發生的概率,換言之,

α錯誤發生的概率為檢驗所選擇的顯著性水平。如果是單側檢驗,棄真錯誤的概率則為

α/2。

(2)

上面是對兩類錯誤的計算,對於第二個問題只需要在第二類錯誤計算過程中變換一下:

1-

對上面的公式進行轉換查表可以求出n=34

(3)根據(1)中公式可以看出,n趨向正無窮時,

對於兩類錯誤的理解上,公認的觀點是:

犯ⅰ類錯誤得危害較大,由於報告了本來不存在的現象,則因此現象而衍生出的後續研究、應用的危害將是不可估量的。相對而言,ⅱ類錯誤的危害則相對較小,因為研究者如果對自己的假設很有信心,可能會重新設計實驗,再次來過,直到得到自己滿意的結果(但是如果對本就錯誤的觀點堅持的話,可能會演變成ⅰ類錯誤)。

當然這要從更多的維度和不同的情況來看,

比如:判定乙個嫌疑人是不是犯了罪,原假設就是這個人沒有犯罪,

那麼犯一類錯誤就是認為罪犯有罪,而事實上沒有犯罪,也就是被冤枉。犯二類錯誤就是把有罪的人判定成無罪。

到底那種對於社會的危害更大呢?這個很難說,如果你認為,我寧可錯殺三千,絕不放過乙個!那你就讓第二類錯誤的概率盡可能小。政治清明的年代,司法應該盡可能減少冤假錯案,即所謂疑罪從無和無罪推定的原則。也就是,如果沒有足夠的人說嫌疑人不是好人,那麼司法就應該判定嫌疑人為好人。因為正常情況下,大部分人都是無罪的,原假設也認為嫌疑人是無罪的,而犯罪的人是少數,所以如果一類錯誤概率大的話,會講很大一部分人無辜的牽連進來;也可以這樣理解,就是無罪的人基數很大,即人數非常多,你稍微把一類錯誤的概率放大一點就會有很多的人被認定為有罪的。

再比如說,我們檢查一批燈泡的壽命,原假設認為燈泡壽命是合格的,但是我們抽查的時候恰好查到了壽命比較低的,這樣就拒絕了原假設,認為這一批燈泡是不合格的。那麼結果是什麼呢?就需要把這一批燈泡全部返廠重新檢測、返修,甚至是銷毀。如果是因為犯了第一類錯誤,也就是本來這一批是合格的,但是因為檢驗正好檢驗到了不合格的才導致拒絕原假設的話,那麼這個成本對於生產廠商來說是非常大的。

我們再看乙個例子,就是我們出門要不要帶傘的問題。

正常來講,原假設為天氣為晴天,那麼犯一類錯誤的情況就是晴天帶傘出門,犯第二類錯誤的情況是下雨不帶傘。

對於我們那一情況危害或者說壞處更大呢?因為畢竟下雨天是少數,如果你天天帶傘出門的話固然是可以避免淋雨,但是你得天天帶傘,要看你是不是方便,如果你方便那麼一類錯誤對你來說影響不是很大;如果帶傘不方便那麼一類錯誤對你的影響就比較大了。

這裡並不是說不用避免犯第二類錯誤,第二類錯誤也是需要盡量避免的。只不過根據無罪推定原則和疑罪從無原則,我們應該控制的是盡可能別把沒罪判為有罪,其次應該控制的才是盡可能減少讓有罪的人繼續逍遙法外。

而且我們對於一類、二類錯誤的控制上還要看具體情況,比如非典期間,我們為了儘量減少病原的傳播,就不惜大量的精力來減少犯二來錯誤的概率,我們對所有人進行體溫測量,只要發現發燒立即隔離,這裡面我們很容易發現,這裡面可定會有很多的不是攜帶病原體的人被認為是攜帶者,其實這裡就是加大了犯一類錯誤的概率,而儘量減少二類錯誤。因為犯二類錯誤的成本太大,寧可錯誤的隔離3000,也不能放過乙個攜帶者,因為放過乙個就會造成非常嚴重的後果。

假設檢驗的兩類錯誤

棄真錯誤也叫第i類錯誤或 錯誤 它是指 原假設實際上是真的,但通過樣本估計總體後,拒絕了原假設。明顯這是錯誤的,我們拒絕了真實的原假設,所以叫棄真錯誤,這個錯誤的概率我們記為 這個值也是顯著性水平,在假設檢驗之前我們會規定這個概率的大小。取偽錯誤也叫第ii類錯誤或 錯誤 它是指 原假設實際上假的,但...

假設檢驗中的兩類錯誤

在假設檢驗中,出現錯誤的型別有兩種 第一類錯誤 棄真錯誤 原假設為真時拒絕原假設 概率為 第二類錯誤 取偽錯誤 原假設為偽時接受原假設 概率為 h0為真 h0為假 接受h0 正確 1 第二類錯誤 拒絕h0 第一類錯誤 正確 1 第一類錯誤出現的原因 在進行假設檢驗時,我們會抽取乙個樣本進行檢驗,但是...

統計學的假設檢驗

假設檢驗是一種規則,它根據資料樣本所提供的證據,指定是肯定還是否定有關總體的宣告。基本原理是先對總體的特徵作出某種假設,然後通過抽樣研究的統計推理,對此假設應該被拒絕還是接受作出推斷。假設檢驗的基本思想是小概率反證法思想。小概率思想是指小概率事件 p 0.01或p 0.05 在一次試驗中基本上不會發...