假設檢驗 顯著性水平 P值 置信區間

2021-10-23 14:45:31 字數 2085 閱讀 6345

統計學有兩個推斷統計方法,乙個是引數估計,另乙個是假設檢驗。

(1)提出原假設;

假設分為原假設h0和備選假設h1

(2)選擇假設檢驗方法,計算檢驗統計量;

(3)判斷臨界值,得出結論;(根據檢驗統計量或p值)

一般情況下,當p值小於0.05則可以拒絕原假設

當我們做判斷的時候就會面臨著兩種假設檢驗的錯誤

這也可以解釋為什麼原假設一般都是我們要拒絕的假設了,alpha 規定了錯誤拒絕原假設的概率。

通俗點來說,顯著性水平就是犯第一類錯誤(棄真錯誤)的概率。

我們一般設定0.05為顯著性水平,那麼就代表 錯誤的拒絕原假設h0的概率的5%,當p值(也就是我們做實驗出的結果的概率)小於0.05,則拒絕原假設。

例子

一種藥聲稱有90%的**率

我們用100個人做實驗,只有85個人痊癒,那麼是小於90%**率的官方聲稱的,這時候我們用假設檢驗來驗證,置信水平為5%。

置信水平可以看作是極端值出現的概率,如下的例子:**率小於90%的情況出現的概率

h0:**率》=90%

h1: **率<90%

p(x<=85)=0.072573 > 0.05

則不拒絕原假設(注意不是接受原假設)

如果10個人做實驗,5個人痊癒

p(x<=5)=0.001635 < 0.05

則拒絕原假設,發生5 out of 10的概率是0.0016,也就是說發生原假設90%**率的概率實在太小了,小於我們預先設定的0.05顯著性水平,那麼我們就拒絕原假設。

引用知乎馬同學的回答:

乙個硬幣是否均勻,投10次後看正反面朝向次數。

我們假設正面朝向的次數大於8次是極端事件,那麼p(8<=x<=10)的概率就是極端概率,就是p值。

可以把p值看作是極端事件概率的累積

在乙個10次投擲實驗中有9次正面朝上,計算p值等於0.01,也就是出現正面朝上9次以上的極端事件概率是0.01,小於0.05的顯著水平,則拒絕h0:硬幣是均勻的。

我們一般用樣本均值來估計總體均值,可是什麼事都有乙個誤差,樣本估計總體肯定也是,置信區間就是這麼乙個誤差。

例子:從學校抽取100個學生量身高求得平均值來估算整個學校學生的身高平均值,樣本的平均值求得175cm, 根據中心極限定理,樣本均值 = 總體均值。

而[a,b] 就是這個誤差範圍

那麼這裡置信水平又是什麼呢?

可以理解為總體平均值落在這個範圍的概率,通常定為95%。換句話來說,做了100次實驗,就有100個樣本平均值,其中有95個樣本平均值所有的置信區間包含了總體平均值。

詳情請看 馬同學 和 猴子 的回答

100只老鼠作為樣本做實驗,妹紙老鼠注射藥物看老鼠反應時間,得出平均反應時間1.05秒,標準差0.5秒。

總體均值也是1.05秒。來計算總體均值的置信區間

均值是1.05

標準誤差

置信水平設定為95%

查表得出z值為-1.96

a=1.05-1.960.05

b=1.05+1.960.05

置信區間 [-0.952,1.148]

顯著性水平和p值的理解

統計分析的核心是以隨機樣本推斷整體 以h0代表原假設,h1代表它的相反面 p值是指假設h0為真的情況下,發生h1的概率,其實我們抽取到的樣本就是h1。p值可以描述為 假設總體均值為10,我們抽取到的樣本均值為6的概率 假設總體是100個,如果根據樣本計算出的 p值等於0.05,也就是說 假設原假設成...

P值與significant(顯著性)的理解

p值與significant的理解 p值可以理解為結論的風險大小,也就是根據資料得出的結果有多大的錯誤風險,p值越小,結論錯誤的風險越小,即結論越可靠。p值越大,錯誤的風險越大,即結論的可靠性差。實際上significant的含義應該是 非偶然的 當根據樣本資料所得結果是significant,實際...

P值與significant(顯著性)的理解

p值與significant的理解 p值可以理解為結論的風險大小,也就是根據資料得出的結果有多大的錯誤風險,p值越小,結論錯誤的風險越小,即結論越可靠。p值越大,錯誤的風險越大,即結論的可靠性差。實際上significant的含義應該是 非偶然的 當根據樣本資料所得結果是significant,實際...