AB測試 假設檢驗的兩類錯誤

2021-10-04 18:15:10 字數 1512 閱讀 3851

在假設檢驗中,由於樣本資訊的侷限性,所產生的錯誤。

原假設h0正確,但檢驗結論不滿足顯著性水平要求(p-value < α ),進而拒絕了原假設h0。犯i類錯誤的概率記為α。

【原因】

進行假設檢驗時,我們假定小概率事件在一次抽樣過程中是不會發生的。但實際上,小概率事件(樣本中存在極端資料)仍有發生的可能。因此,當小概率事件發生的可能性增大時,就會出現i類錯誤。

假設檢驗中,小概率事件發生的概率之和,我們稱之為顯著性水平(α)。**因此i類錯誤發生的概率,就是我們所選擇的顯著性水平取值。**當顯著性水平取值增大,就容易發生i類錯誤。

例如:根據實驗資料求得p-value = 0.06,在常用置信度為95%,即顯著性水平 α = 0.05時,p-value > 0.05,接受h0。 但當取 α = 0.07時,置信度 1- α = 93%,p-value<0.07,拒絕h0。

根據正態分佈概率取值圖也可理解為,置信區間縮小,導致原本符合正常情況的資料被刨除在外。

原假設h0錯誤,但檢驗結論滿足顯著性水平要求,進而接受原假設h0。犯ii類錯誤的概率記為β。

【原因】

ii類錯誤的概率其實也可以理解為對於顯著性水平取值的調整。通常情況下,我們以5%作為小概率事件發生的臨界值,當我們認為小概率事件發生的概率(β)進一步縮小時,就可能導致置信區間擴大,原本不符合正常情況的資料涵蓋在內。

例如:根據實驗資料求得p-value = 0.04,在常用置信度為95%,即顯著性水平 α = 0.05時,p-value < 0.05,拒絕h0。 但當我們假設小概率事件可能性進一步縮小,即 β = 0.03時,置信度 1- β = 97%,p-value > 0.03,接受h0。

在樣本容量不變的前提下,無法做到同時減少兩種錯誤。此時,兩種錯誤發生的概率呈負相關

在樣本容量不變的前提下,通常先保證i類錯誤概率α的取值較低的情況下,盡量減小ii類錯誤概率β通過增加樣本容量,同時減少兩類錯誤

【例1】法律審判是否有罪:h0:罪犯無罪; h1:罪犯有罪

i類錯誤:罪犯無罪,但判定為有罪

ii類錯誤:罪犯有罪,但判定為無罪

-> 由於社會人口基數足夠大,而犯罪畢竟是少部分的人,因此可以優先考慮避免i類錯誤,即避免冤假錯案。

【例2】大流行傳染性疾病:h0:不是病毒攜帶者 h1:是病毒攜帶者

i類錯誤:不是病毒攜帶者,但判定為攜帶者

ii類錯誤:是病毒攜帶者,但判定為不是攜帶者

-> 當病毒攜帶者被判定為非攜帶者,進而沒有進行有效隔離,就會傳染更多的無辜群眾,導致疾病進一步擴散。對於社會的影響遠大於將非攜帶者認定為攜帶者從而進行有效隔離和救治。因此在這個情況下,優先考慮避免ii類錯誤。

注:如何選擇優先減小哪類錯誤例項參考andy_shenzl 尤其是傳染性疾病情況下的例子,今天學習到更有感觸。

假設檢驗的兩類錯誤

棄真錯誤也叫第i類錯誤或 錯誤 它是指 原假設實際上是真的,但通過樣本估計總體後,拒絕了原假設。明顯這是錯誤的,我們拒絕了真實的原假設,所以叫棄真錯誤,這個錯誤的概率我們記為 這個值也是顯著性水平,在假設檢驗之前我們會規定這個概率的大小。取偽錯誤也叫第ii類錯誤或 錯誤 它是指 原假設實際上假的,但...

假設檢驗中的兩類錯誤

在假設檢驗中,出現錯誤的型別有兩種 第一類錯誤 棄真錯誤 原假設為真時拒絕原假設 概率為 第二類錯誤 取偽錯誤 原假設為偽時接受原假設 概率為 h0為真 h0為假 接受h0 正確 1 第二類錯誤 拒絕h0 第一類錯誤 正確 1 第一類錯誤出現的原因 在進行假設檢驗時,我們會抽取乙個樣本進行檢驗,但是...

統計學假設檢驗的兩類錯誤

我們之前 了假設檢驗的基本思想,現在我們來介紹下兩類錯誤。假設檢驗的最終目的是 去偽存真,那麼它對應的兩類錯誤就是棄真存偽。接受或拒絕h0,都可能犯錯誤i類錯誤 棄真錯誤,發生的概率為 ii類錯誤 取偽錯誤,發生的概率為 為了更形象點說明這兩類錯誤,我們看下下面這個 對於正常情況下對於上面例項的假設...