AB測試假設檢驗的兩類錯誤

在假設檢驗中，由於樣本資訊的侷限性，所產生的錯誤。

原假設h0正確，但檢驗結論不滿足顯著性水平要求（p-value < α ），進而拒絕了原假設h0。犯i類錯誤的概率記為α。

【原因】

進行假設檢驗時，我們假定小概率事件在一次抽樣過程中是不會發生的。但實際上，小概率事件（樣本中存在極端資料）仍有發生的可能。因此，當小概率事件發生的可能性增大時，就會出現i類錯誤。

假設檢驗中，小概率事件發生的概率之和，我們稱之為顯著性水平（α）。**因此i類錯誤發生的概率，就是我們所選擇的顯著性水平取值。**當顯著性水平取值增大，就容易發生i類錯誤。

例如：根據實驗資料求得p-value = 0.06，在常用置信度為95%，即顯著性水平 α = 0.05時，p-value > 0.05，接受h0。但當取 α = 0.07時，置信度 1- α = 93%，p-value<0.07，拒絕h0。

根據正態分佈概率取值圖也可理解為，置信區間縮小，導致原本符合正常情況的資料被刨除在外。

原假設h0錯誤，但檢驗結論滿足顯著性水平要求，進而接受原假設h0。犯ii類錯誤的概率記為β。

【原因】

ii類錯誤的概率其實也可以理解為對於顯著性水平取值的調整。通常情況下，我們以5%作為小概率事件發生的臨界值，當我們認為小概率事件發生的概率（β）進一步縮小時，就可能導致置信區間擴大，原本不符合正常情況的資料涵蓋在內。

例如：根據實驗資料求得p-value = 0.04，在常用置信度為95%，即顯著性水平 α = 0.05時，p-value < 0.05，拒絕h0。但當我們假設小概率事件可能性進一步縮小，即 β = 0.03時，置信度 1- β = 97%，p-value > 0.03，接受h0。

在樣本容量不變的前提下，無法做到同時減少兩種錯誤。此時，兩種錯誤發生的概率呈負相關

在樣本容量不變的前提下，通常先保證i類錯誤概率α的取值較低的情況下，盡量減小ii類錯誤概率β通過增加樣本容量，同時減少兩類錯誤

【例1】法律審判是否有罪：h0：罪犯無罪； h1：罪犯有罪

i類錯誤：罪犯無罪，但判定為有罪

ii類錯誤：罪犯有罪，但判定為無罪

-> 由於社會人口基數足夠大，而犯罪畢竟是少部分的人，因此可以優先考慮避免i類錯誤，即避免冤假錯案。

【例2】大流行傳染性疾病：h0：不是病毒攜帶者 h1：是病毒攜帶者

i類錯誤：不是病毒攜帶者，但判定為攜帶者

ii類錯誤：是病毒攜帶者，但判定為不是攜帶者

-> 當病毒攜帶者被判定為非攜帶者，進而沒有進行有效隔離，就會傳染更多的無辜群眾，導致疾病進一步擴散。對於社會的影響遠大於將非攜帶者認定為攜帶者從而進行有效隔離和救治。因此在這個情況下，優先考慮避免ii類錯誤。

注：如何選擇優先減小哪類錯誤例項參考andy_shenzl 尤其是傳染性疾病情況下的例子，今天學習到更有感觸。

AB測試 假設檢驗的兩類錯誤