統計學有兩個推斷統計方法,乙個是引數估計,另乙個是假設檢驗。
(1)提出原假設;
假設分為原假設h0和備選假設h1
(2)選擇假設檢驗方法,計算檢驗統計量;
(3)判斷臨界值,得出結論;(根據檢驗統計量或p值)
一般情況下,當p值小於0.05則可以拒絕原假設
當我們做判斷的時候就會面臨著兩種假設檢驗的錯誤
這也可以解釋為什麼原假設一般都是我們要拒絕的假設了,alpha 規定了錯誤拒絕原假設的概率。
通俗點來說,顯著性水平就是犯第一類錯誤(棄真錯誤)的概率。
我們一般設定0.05為顯著性水平,那麼就代表 錯誤的拒絕原假設h0的概率的5%,當p值(也就是我們做實驗出的結果的概率)小於0.05,則拒絕原假設。
例子:
一種藥聲稱有90%的**率
我們用100個人做實驗,只有85個人痊癒,那麼是小於90%**率的官方聲稱的,這時候我們用假設檢驗來驗證,置信水平為5%。
置信水平可以看作是極端值出現的概率,如下的例子:**率小於90%的情況出現的概率
h0:**率》=90%
h1: **率<90%
p(x<=85)=0.072573 > 0.05
則不拒絕原假設(注意不是接受原假設)
如果10個人做實驗,5個人痊癒
p(x<=5)=0.001635 < 0.05
則拒絕原假設,發生5 out of 10的概率是0.0016,也就是說發生原假設90%**率的概率實在太小了,小於我們預先設定的0.05顯著性水平,那麼我們就拒絕原假設。
引用知乎馬同學的回答:
乙個硬幣是否均勻,投10次後看正反面朝向次數。
我們假設正面朝向的次數大於8次是極端事件,那麼p(8<=x<=10)的概率就是極端概率,就是p值。
可以把p值看作是極端事件概率的累積
在乙個10次投擲實驗中有9次正面朝上,計算p值等於0.01,也就是出現正面朝上9次以上的極端事件概率是0.01,小於0.05的顯著水平,則拒絕h0:硬幣是均勻的。
我們一般用樣本均值來估計總體均值,可是什麼事都有乙個誤差,樣本估計總體肯定也是,置信區間就是這麼乙個誤差。
例子:從學校抽取100個學生量身高求得平均值來估算整個學校學生的身高平均值,樣本的平均值求得175cm, 根據中心極限定理,樣本均值 = 總體均值。
而[a,b] 就是這個誤差範圍
那麼這裡置信水平又是什麼呢?
可以理解為總體平均值落在這個範圍的概率,通常定為95%。換句話來說,做了100次實驗,就有100個樣本平均值,其中有95個樣本平均值所有的置信區間包含了總體平均值。
詳情請看 馬同學 和 猴子 的回答
100只老鼠作為樣本做實驗,妹紙老鼠注射藥物看老鼠反應時間,得出平均反應時間1.05秒,標準差0.5秒。
總體均值也是1.05秒。來計算總體均值的置信區間
均值是1.05
標準誤差
置信水平設定為95%
查表得出z值為-1.96
a=1.05-1.960.05
b=1.05+1.960.05
置信區間 [-0.952,1.148]
顯著性水平和p值的理解
統計分析的核心是以隨機樣本推斷整體 以h0代表原假設,h1代表它的相反面 p值是指假設h0為真的情況下,發生h1的概率,其實我們抽取到的樣本就是h1。p值可以描述為 假設總體均值為10,我們抽取到的樣本均值為6的概率 假設總體是100個,如果根據樣本計算出的 p值等於0.05,也就是說 假設原假設成...
P值與significant(顯著性)的理解
p值與significant的理解 p值可以理解為結論的風險大小,也就是根據資料得出的結果有多大的錯誤風險,p值越小,結論錯誤的風險越小,即結論越可靠。p值越大,錯誤的風險越大,即結論的可靠性差。實際上significant的含義應該是 非偶然的 當根據樣本資料所得結果是significant,實際...
P值與significant(顯著性)的理解
p值與significant的理解 p值可以理解為結論的風險大小,也就是根據資料得出的結果有多大的錯誤風險,p值越小,結論錯誤的風險越小,即結論越可靠。p值越大,錯誤的風險越大,即結論的可靠性差。實際上significant的含義應該是 非偶然的 當根據樣本資料所得結果是significant,實際...