假設:對總體引數的具體數值所做的陳述。
假設檢驗:先對總體引數提出某種假設,然後利用樣本資訊判斷假設是否成立的過程。
零假設:通常將研究者想收集證據予以反對的假設稱為原假設(零假設)用h0表示。
備擇假設:通常將研究者想收集證據予以支援的假設稱為備擇假設(研究假設)用h1表示。
eg:一種零件的標準是直徑10cm,對生產過程進行控制,確定這台工具機生產是否的零件是否符合標準要求。進行調整,陳述用檢驗生產過程是否正常的原假設和備擇假設?
h0:μ=10(生產過程正常) 反對
h1:μ≠10(生產過程不正常)支援
建立假設的幾點認識:
①原假設和備擇假設必有乙個成立,而且只有乙個成立;
②通常先確定備擇假設,再確定零假設,因為備擇假設是我們關心的;
③在假設檢驗中,等號總是放在原假設上,為數學表述上的方便,我們將與h1對立的所有可能情況放進了只含乙個符號的原假設之中;
④具有方向性的假設 稱為單側假設(單尾檢驗),沒有方向性,假設稱為雙側假設(雙尾假設);
單側假設(單尾假設):備擇假設具有特定的方向性,並含有符號 『>』 或 『
雙側檢驗(雙尾檢驗):備擇假設沒有特定的方向性,並含有符號 『≠』 的假設檢驗。
假設檢驗的基本形式:
假設雙側檢驗
單側檢驗
左側檢驗
右側檢驗
原假設h0:μ=μ0
h0:μ≥μ0
h0:μ≤μ0
備擇假設
h1:μ≠μ0
h1:μ
h1:μ>μ0
假設檢驗的目的是根據樣本資訊做出決策,也就是作出吃否拒絕原假設而傾向於備擇假設的決策。因為原假設和備擇假設不能同時成立。
第i類錯誤(棄真假設):當原假設為真時,拒絕原假設 【α】。
第ii類錯誤(取偽假設):當原假設為假時沒有拒絕原假設 【β】 。
決策結果
實際情況
h0為真
h0為假
未拒絕h0
正確決策
第ii類錯誤β
拒絕h0
第i類錯誤α
正確決策
注意:只有原假設被拒絕時,才會犯第i類錯誤;當原假設未被拒絕時,會犯第ii類錯誤。由於犯第i類錯誤的概率是由研究者控制的,因此在假設檢驗中,往往控制第i類錯誤的發生概率。發生第i類錯誤的概率也常被用於檢驗結論的可靠性,並將這一概率稱為顯著性水平。
顯著性水平:假設檢驗中犯的第i類錯誤的概率。【α】
顯著性水平是事先指定的犯第i類錯誤的概率α的最大允許值。犯第i類錯誤的後果更嚴重,因此α會取值比較小。通常選擇顯著性水平為0.05或比0.05更小的概率。通常α=0.01、α=0.05、α=0.1等。
在確定顯著性水平α就等於控制了第i類錯誤的概率,但是第ii類錯誤的概率β不確定。因此,在假設檢驗中我們採用「不拒絕h0」,避免第ii類錯誤的發生風險。
提出具體假設後,研究者需要提供可靠的證據來支援所提出的備擇假設。資訊主要來自所取得樣本,檢驗統計量便於對樣本資訊進行壓縮和概括。
檢驗統計量:根據樣本觀測結果計算得到的,並據以對原假設和備擇假設作出決策的某個樣本統計量。
檢驗統計量實際是總體引數的點估計量(樣本均值就是總體均值的乙個點估計量),將點估計量標準化後,才能用與度量它與原假設的引數值之間的差異程度,對點估計量標準化的依據是:①原假設為h0為真②點估計量的抽樣分布。標準化檢驗統計量簡稱為檢驗統計量。
標準化的檢驗統計量可表示:
標準化的檢驗統計量=點估計量—假設值/點估計量的抽樣標準差
拒絕域:能夠拒絕原假設的檢驗統計量的所有可能取值的集合。
拒絕域就是顯著性水平α所圍成的區域。樣本觀測結果數值落在拒絕域內,就拒絕原假設。拒絕域的大小與選定的顯著水平有一定關係,確定顯著性水平α後,根據α確定拒絕域的具體邊界值,拒絕與的邊界值稱為臨界值。
臨界值:根據給定的顯著性水平確定的拒絕與的邊界值。
根據給定的α,得到臨界值 。將檢驗統計量的值與臨界值進行比較,作出是否拒絕原假設的決策。當樣本固定,拒絕域的未知則取決於檢驗是單側檢驗還是雙側檢驗。雙側檢驗的拒絕域在抽樣分布的兩側;備擇假設具有符號『』,則拒絕域位於抽樣分布的右側,稱右側檢驗。在給定顯著性水平α條件下,拒絕域與臨界值如下圖:
顯著性水平α是在檢驗之前確定的,也就是確定了拒絕域,不論檢驗統計量的值是大小,如果落在拒絕域就拒絕原假設h0,由於α是犯第i類錯誤的上線控制值,只是個可靠性的大致範圍,無法給出精確度量。要測量出樣本觀測資料與原假設中假設的值μ0的偏離程度,則需要計算p值。
p值(觀察到的顯著性水平):在原假設為真的條件下,檢驗統計量的觀察值大於或等於其值的概率。
p值反應時間觀測到的資料與原假設h0之間不一致程度的乙個概率值。p值越小,說明實際觀測到的資料與h0之間不一致的程度越大,檢驗的結果也就越顯著。
p值是當原假設正確時,得到的所觀測資料的概率。
p值進行決策方法簡單,與α進行比較,可判斷是否拒絕原假設。不論是單雙檢測,用p值進行決策的準則都是:p值
利用統計量根據顯著性水平作出決策,如果我們拒絕原假設,也僅僅是知道犯錯誤的可能性是α那麼大,而p值則是犯錯誤的實際概率。
假設檢驗的重要一步是 確定適當的檢驗統計量,大樣本情況下,樣本均值的抽樣分布近似服從正態分佈,抽樣標準差是σ/√n。
eg:一種飲料,每罐的容量是255ml,標準差為5ml,為檢驗每罐容量是否符合要求,質檢人員隨機抽取40罐進行檢測,測得每罐的平均容量為255.8ml。取顯著性水平α=0.05,檢驗是否符合標準。
h0:μ=255
h1:μ≠255
計算檢驗統計量的具體數值:
z=(255.8-255)/5√40=1.01
檢驗統計量的含義:樣本均值與檢驗的總體均值相比,相差1.01個抽樣標準差。
雙側檢驗取值: zα/2 單側檢驗取值: zα
α=0.05 zα/2=z0.025=1.96.由於|z|=1.01用p值檢驗
excel norm.s.dist 函式,將z的絕對值1.01錄入,得到結果0.844,
雙側檢驗p值:2(1-p值) 單側檢驗p值:1-p值*
z=1.01 雙側檢驗最後的p值為:p=2*(1-0.844)=0.312 > α=0.05 不拒絕h0,檢驗結果表明:沒有證據表明生產的飲料不符合標準要求。
檢測與大樣本總體均值檢測一樣,區分大樣本,小樣本,是因為大樣本的統計量用正態分佈,小樣本用t分布。
總結:兩種情形:①大樣本條件下,總體均值的檢驗採用正態分佈統計量,②小樣本,總體均值的檢驗採用t分布統計量。不論是總體均值的檢驗還是比例檢驗,除了利用計算檢驗外,可之間用p值進行檢驗。
假設檢驗 假設檢驗學習筆記
在實際工作和研究中,往往只能獲得資料的一部分,通常指這個資料為樣本,而通過樣本對整體的估計被稱為假設檢驗。樣本是從整體中選取的較小集合,中心極限定律 樣本的均值約等於總體的均值 不管整體什麼分布,任意乙個總體的樣本均值都會圍繞在總體的均值周圍,且呈正太分布。關鍵資訊 樣本的均值等於總體的均值 樣本的...
假設檢驗 到底該怎麼理解假設檢驗?
學過統計學或概率論的同學,對 假設檢驗 這個詞一定不陌生。因為期末考試的卷子裡必定會考一道這種題,那個時候,我其實對假設檢驗的流程並不是很理解,不過幸好流程簡單,照葫蘆畫瓢,套一套格式就能答對。那假設檢驗到底是個什麼東西?先上一道假設檢驗的例題,回憶一下假設檢驗的流程,找一下當初的感覺。某工具機廠加...
(六)假設檢驗
假設檢驗的步驟 步驟1 提出原假設與備擇假設 步驟2 指定檢驗中的顯著性水平 步驟3 蒐集樣本資料並計算檢驗統計量的值 p 值方法 步驟4 利用檢驗統計量的值計算p 值 步驟5 如果p 值 a,則拒絕h0 臨界值方法 步驟6 顯著性水平確定臨界值以及拒絕規則 步驟7 利用檢驗統計量的值以及拒絕規則確...