假設檢驗顯著性水平 P值置信區間

統計學有兩個推斷統計方法，乙個是引數估計，另乙個是假設檢驗。

（1）提出原假設；

假設分為原假設h0和備選假設h1

（2）選擇假設檢驗方法，計算檢驗統計量；

（3）判斷臨界值，得出結論；（根據檢驗統計量或p值）

一般情況下，當p值小於0.05則可以拒絕原假設

當我們做判斷的時候就會面臨著兩種假設檢驗的錯誤

這也可以解釋為什麼原假設一般都是我們要拒絕的假設了，alpha 規定了錯誤拒絕原假設的概率。

通俗點來說，顯著性水平就是犯第一類錯誤（棄真錯誤）的概率。

我們一般設定0.05為顯著性水平，那麼就代表錯誤的拒絕原假設h0的概率的5%，當p值（也就是我們做實驗出的結果的概率）小於0.05，則拒絕原假設。

例子：

一種藥聲稱有90%的**率

我們用100個人做實驗，只有85個人痊癒，那麼是小於90%**率的官方聲稱的，這時候我們用假設檢驗來驗證，置信水平為5%。

置信水平可以看作是極端值出現的概率，如下的例子：**率小於90%的情況出現的概率

h0：**率》=90%

h1: **率<90%

p(x<=85)=0.072573 > 0.05

則不拒絕原假設（注意不是接受原假設）

如果10個人做實驗，5個人痊癒

p(x<=5)=0.001635 < 0.05

則拒絕原假設，發生5 out of 10的概率是0.0016，也就是說發生原假設90%**率的概率實在太小了，小於我們預先設定的0.05顯著性水平，那麼我們就拒絕原假設。

引用知乎馬同學的回答：

乙個硬幣是否均勻，投10次後看正反面朝向次數。

我們假設正面朝向的次數大於8次是極端事件，那麼p(8<=x<=10)的概率就是極端概率，就是p值。

可以把p值看作是極端事件概率的累積

在乙個10次投擲實驗中有9次正面朝上，計算p值等於0.01，也就是出現正面朝上9次以上的極端事件概率是0.01，小於0.05的顯著水平，則拒絕h0：硬幣是均勻的。

我們一般用樣本均值來估計總體均值，可是什麼事都有乙個誤差，樣本估計總體肯定也是，置信區間就是這麼乙個誤差。

例子：從學校抽取100個學生量身高求得平均值來估算整個學校學生的身高平均值，樣本的平均值求得175cm, 根據中心極限定理，樣本均值 = 總體均值。

而[a,b] 就是這個誤差範圍

那麼這裡置信水平又是什麼呢？

可以理解為總體平均值落在這個範圍的概率，通常定為95%。換句話來說，做了100次實驗，就有100個樣本平均值，其中有95個樣本平均值所有的置信區間包含了總體平均值。

詳情請看馬同學和猴子的回答

100只老鼠作為樣本做實驗，妹紙老鼠注射藥物看老鼠反應時間，得出平均反應時間1.05秒，標準差0.5秒。

總體均值也是1.05秒。來計算總體均值的置信區間

均值是1.05

標準誤差

置信水平設定為95%

查表得出z值為-1.96

a=1.05-1.960.05

b=1.05+1.960.05

置信區間 [-0.952,1.148]

顯著性水平和p值的理解

統計分析的核心是以隨機樣本推斷整體以h0代表原假設，h1代表它的相反面 p值是指假設h0為真的情況下，發生h1的概率，其實我們抽取到的樣本就是h1。p值可以描述為假設總體均值為10，我們抽取到的樣本均值為6的概率假設總體是100個，如果根據樣本計算出的 p值等於0.05，也就是說假設原假設成...

P值與significant（顯著性）的理解

p值與significant的理解 p值可以理解為結論的風險大小，也就是根據資料得出的結果有多大的錯誤風險，p值越小，結論錯誤的風險越小，即結論越可靠。p值越大，錯誤的風險越大，即結論的可靠性差。實際上significant的含義應該是非偶然的當根據樣本資料所得結果是significant，實際...

假設檢驗 顯著性水平 P值 置信區間

顯著性水平和p值的理解

P值與significant（顯著性）的理解

P值與significant（顯著性）的理解

相關推薦

假設檢驗顯著性水平 P值置信區間