關於假設檢驗

2022-07-22 00:33:21 字數 3978 閱讀 7023

前面寫了乙個引數估計,現在也順便把假設檢驗也總結一下吧,主要參考書還是那本《概率論與數理統計》(陳希孺)。

假設檢驗就是提出乙個命題,根據樣本判斷對錯。

有乙個已知分布的總體,其中個別引數未知。現在抽取的一組樣本\(x_1,x_2,\cdots,x_n\),並針對該未知引數而提出乙個命題(命題正確與否完全由該未知引數決定),稱為原假設\(h_0\),其否定稱為備擇假設或對立假設\(h_1\);任務是:提出乙個檢驗\(\phi\),並根據此檢驗,判斷接受原命題還是備擇命題。

檢驗\(\phi\)是乙個判斷準則,對於乙個問題,可以提出許多種檢驗。

例:原來一種產品質量指標符合正態分佈\(n(\mu_1,\sigma^2)\),經過工藝改進後其均值可能有提高(設為\(\mu_2\)),為驗證是否提高,現在抽出樣本\(x_1,\cdots,x_n\);原假設\(h_0:\\),備擇假設\(h_1:\\);提出檢驗\(\phi\):若\(\hat\geqslant c\)則接受原命題,否則拒絕原命題,\(c\)為某待定常數。

按上面所說,接受\(h_0\)與否,取決於抽到的樣本如何。所謂接受域是這樣乙個集合$$a=$$拒絕域是這樣乙個集合$$b=$$

因為檢驗可以有很多種,同乙個樣本,在不同的檢驗下,會得出不同的結論,檢驗之間自然也存在著優劣之分。標誌著某檢驗的效能的量叫做某檢驗的功效函式。

定義:設總體的未知引數為\(\lambda\),則\(\beta_\phi(\lambda)=p_(根據\phi拒絕h_0)\)為檢驗\(\phi\)的功效函式。

在功效函式的定義中,概率\(p(\cdot)\)的下標\(\lambda\)表示的意思是:令總體的未知參量為某\(\lambda\)值時,抽取樣本,根據檢驗\(\phi\)分析樣本後拒絕原假設的概率。也就是說某檢驗的功效函式是系統未知參量的函式,功效函式等於被原假設被拒絕的概率

並非單純地功效函式越大,檢驗就越優。這裡要分情況考慮:由於\(h_0\)正確與否完全取決於系統未知引數的值,所以對於所有使得\(h_0\)成立的引數的值,我們希望我們的檢驗拒絕\(h_0\)的概率越低越好(功效函式盡量小);反過來,對於所有使得\(h_1\)成立的引數的值,我們希望我們的檢驗拒絕\(h_0\)的概率越高越好(功效函式盡量大)。

上圖中,\(h_0:\lambda<0\),\(h_1:\lambda\geqslant0\),在\(\lambda<0\)時應該接受原假設,所以乙個更優的檢驗的功效函式應該具有更小的值;同理在\(\lambda\geqslant0\)時,乙個更優的檢驗的功效函式應該具有更大的值,所以上圖中檢驗\(\phi_1\)比檢驗\(\phi_2\)更優

由上圖可見,即使選擇了乙個非常優秀的檢驗,也可能在不該拒絕的時候拒絕,在不該接受的時候接受。所謂第一類錯誤指的是:\(h_0\)正確但檢驗拒絕了它;第二類錯誤指的是:\(h_0\)錯誤,但檢驗接受了它。在上圖中的反應就是,在區間\([-\infty,0_-]\)上,功效函式要始終值很小才能盡量避免第一類錯誤,在區間\([0_+,+\infty]\)上,功效函式應該值始終很大才能盡量避免第二類錯誤。

想同時處理好這兩類錯誤是不可能的:觀察\(\lambda=0\)處取值\(\beta_\phi(\lambda)|_\)記為\(s\),因為功效函式是連續的,如果\(s\)太大,則在\(0_-\)附近,第一類錯誤出現的概率會增大;如果\(s\)太小,則在\(0_+\)附近,第二類錯誤出現的概率會增大。換句話說,要求同時處理好這兩類錯誤,就等於要求功效函式在區間\([0_-,0_+]\)上是急增長的,而這是不可能的。

所以一般處理方法的思想是,先令第一類錯誤概率不超過某個確定的小量\(\alpha\),再調節第二類錯誤概率使其盡量低。

定義:設\(\phi\)是原假設\(h_0\)的乙個檢驗,\(\beta_\phi(\lambda_1,\cdots,\lambda_k)\)為其功效函式,\(\alpha\in[0,1]\)是乙個常數,如果對於任意\((\lambda_1,\cdots,\lambda_k)\in h_0\)滿足$$\beta_\phi(\lambda_1,\cdots,\lambda_k)\leqslant\alpha$$則稱\(\phi\)為\(h_0\)的乙個水平為\(\alpha\)的檢驗。

*如果有檢驗\(\phi\),水平為\(\alpha\),且對於任何乙個其他的水平同為\(\alpha\)的檢驗\(\psi\)都有$$\beta_\phi(\lambda_1,\cdots,\lambda_k)\geqslant\beta_\psi(\lambda_1,\cdots,\lambda_k), \forall(\lambda_1,\cdots,\lambda_k)\in h_0'$$則稱檢驗\(\phi\)是水平\(\alpha\)的一致最優檢驗。很多情況下,一致最優檢驗是不存在的。

總體方差\(\sigma^2\)已知,檢驗總體均值\(\mu\)

例題:設\(x_1,\cdots,x_n\)是來自正態總體\(n(\mu,\sigma^2)\)的樣本,其中\(\sigma^2\)已知,提出假設如下(\(\mu_0\)是乙個常數)\(h_0:\mu\geqslant\mu_0\),\(h_1:\mu

提出檢驗\(\phi:當\bar\geqslant c\)時接受原假設,否則拒絕. 考慮功效函式$$\beta_(\mu)=p_\mu(\bar\(\sqrt(\bar-\mu)/\sigma\sim n(0,1)\),以\(\psi(\cdot)\)記其累積分布函式cdf,根據cdf的意義,可以得出$$\beta_(\mu)=\psi(\sqrt(c-\mu)/\sigma)$$它是\(\mu\)的減函式。控制第一類錯誤的概率不超過\(\alpha=0.05\)可以表達為:對\(\mu\geqslant\mu_0\),\(\beta_(\mu)

這樣,檢驗\(\phi\)就滿足了第一類錯誤概率小於\(\alpha=0.05\),至於第二類錯誤,如果要求第二類錯誤概率一律低於\(\beta=0.05\),則這是不可能的:已經限制了\(\beta_(\mu_)=\alpha=0.05\),不可能再限制\(\beta_(\mu_)\geqslant1-\beta=0.95\). 所以要處理第二類錯誤,只能放寬要求:對某個指定的\(\mu_0'

這就要求(因為\(\beta_(\mu)\)是單減的)$$\beta_(\mu_0')=\psi(\sqrt(c-\mu_0')/\sigma)=1-\beta$$代入上面求的常數\(c\),可得(設\(\mu_\beta\)是另乙個分位點)$$\psi\left(\frac(\mu_0-\mu_0')}-\mu_\alpha\right)=1-\beta\rightarrow\frac(\mu_0-\mu_0')}-\mu_\alpha\geqslant \mu_\beta$$解不等式得出$$n\geqslant\sigma2\frac$$這就要求樣本容量足夠大。至此,似乎得出了乙個奇怪的結論:要求第二類錯誤概率足夠低,卻推出了樣本容量不能太小。實際上解釋是:樣本容量越大,越能反應出總體的特徵,解析度越高(\(\bar\)越精確),從而犯第二類錯誤的可能性越小。

總體方差\(\sigma^2\)未知,檢驗總體均值\(\mu\)

問題和前面一樣,只不過條件換成總體的方差未知。這時提出的檢驗\(\phi\)和上面類似,但使用樣本標準差\(s\)代替\(\sigma\),同時,把正態分佈換成自由度為\(n-1\)的\(t\)分布:$$\phi:當\sqrt(\bar-\mu_0)/s\geqslant-t_(\alpha)時接受h_0,否則拒絕.$$證明思路是,寫出該檢驗的功效函式,它是\(\mu\)和\(\sigma\)的二元函式,但是當\(\mu=\mu_0\)時其值為\(\alpha\)(因為這時\(\sqrt(\bar-\mu_0)/s\)服從\(t\)分布),可以分析得出,當\(\mu>\mu_0\)時,功效函式的值小於\(\alpha\),所以只需要把\(\mu=\mu_0\)處作為臨界值就可以了。

假設檢驗 假設檢驗學習筆記

在實際工作和研究中,往往只能獲得資料的一部分,通常指這個資料為樣本,而通過樣本對整體的估計被稱為假設檢驗。樣本是從整體中選取的較小集合,中心極限定律 樣本的均值約等於總體的均值 不管整體什麼分布,任意乙個總體的樣本均值都會圍繞在總體的均值周圍,且呈正太分布。關鍵資訊 樣本的均值等於總體的均值 樣本的...

假設檢驗 到底該怎麼理解假設檢驗?

學過統計學或概率論的同學,對 假設檢驗 這個詞一定不陌生。因為期末考試的卷子裡必定會考一道這種題,那個時候,我其實對假設檢驗的流程並不是很理解,不過幸好流程簡單,照葫蘆畫瓢,套一套格式就能答對。那假設檢驗到底是個什麼東西?先上一道假設檢驗的例題,回憶一下假設檢驗的流程,找一下當初的感覺。某工具機廠加...

(六)假設檢驗

假設檢驗的步驟 步驟1 提出原假設與備擇假設 步驟2 指定檢驗中的顯著性水平 步驟3 蒐集樣本資料並計算檢驗統計量的值 p 值方法 步驟4 利用檢驗統計量的值計算p 值 步驟5 如果p 值 a,則拒絕h0 臨界值方法 步驟6 顯著性水平確定臨界值以及拒絕規則 步驟7 利用檢驗統計量的值以及拒絕規則確...