統計學03 假設檢驗

2021-09-22 19:18:50 字數 1413 閱讀 4053

假設檢驗本質是一種逆向思維的應用。用大白話講,就是假如你想證明自己能辦成一件事,可以先假設你辦不成這件事,通過證明辦不成這件事發生的概率非常小來論證這件事是可以辦成的。

在統計學中,這個辦不成這件事的假設被稱為零假設,記為h

0h_0

h0​,而你辦成這件事的假設(在事實發生之前同樣是假設)被稱為備擇假設,記為h

1h_1

h1​。

至於具體如何證明這就需要用到前面兩篇講到的中心極限定理和置信空間的知識,這裡簡單描述下。通過隨機抽樣可以得到樣本均值和其方差,同時我們可以通過中心極限定理得出樣本均值抽樣分布的均值(樣本容量越大越近似正態分佈)和其方差。注意樣本均值只是樣本均值抽樣分布所有值的其中之一。當零假設成立時,我們可以通過判斷得到樣本均值在樣本均值抽樣分布的概率來進行推斷,當這個概率非常小時,比如小於5%時,我們就拒絕這個零假設,接受備擇假設,而這個5%的值被稱為顯著性。

注意顯著性不是固定的,而是我們提前設定的,同時顯著性是5%,那麼對應的置信空間就是1-5%,即95%。置信空間這同樣是人為設定的,其不是說這件事一定有95%概率會發生,準確地講是我們有95%的成分相信這件事會發生。這裡雖然有點繞,但是目的是為了突出一點,即顯著性與置信空間都是人為設定的。通常情況下,人們約定如果零假設成立的概率小於5%,那麼我們就應該拒絕零假設,畢竟相比5%,95%發生的概率要大得多。

你可能有個疑問?如果有萬一呢?不管多少,5%概率總是有可能發生的吧。在統計學中,將這種拒絕零假設而產生錯誤的問題稱為第一型別錯誤。

我們知道正態分佈呈兩邊對稱的形態。結合上面假設檢驗知識,在正方向上小於5%的概率和在負方向上小於-5%的概率都是可以作為拒絕零假設的理由。這裡舉例說明下。在醫學實驗中,假如想證明一種新型研製的藥物可以刺激生物神經從而影響其反應時間,那麼不論是增加其反應時間還是縮短其反應時間都能證明這種藥物是有效的。如果臨床試驗的目的是為了證明藥物有效的,不論正負,那麼在統計證明中就應該做雙側檢驗,但如果是為了證明藥物是可以縮短生物反應時間的,在統計證明中就應該採用單側檢驗。

因此具體採取哪種檢驗是由實際需求決定的。

當隨機抽樣樣本容量較小時,其樣本分佈一般不是正態分佈,而是t分布,t分布一般尾部較肥,這時我們採用t統計,結合t值表進行概率推論;相反則採用z統計結合z值表進行概率推論。根據中心極限定理可以知道,大樣本容量的均值抽樣分布符合正態分佈,z分布能很好地反映總體分布情況。這個樣本量的界限一般設定為30,也就是說樣本容量小於30用t統計量和查詢t值表,大於30則用z統計量和z值表。

對於不相關的兩個隨機變數來說:

和之期望等於期望之和,

和之均值等於均值之和,

差之期望等於期望之差,

差之均值等於均值之差,

和之方差等於方差之和,

差之方差等於方差之和,

任何變數的期望與其自身相反數的期望相等。

重點注意下,差之方差等於方差之和。這個結論可以由變數期望(均值)與其自身相反數期望(均值)相等推斷得到。

統計學的假設檢驗

假設檢驗是一種規則,它根據資料樣本所提供的證據,指定是肯定還是否定有關總體的宣告。基本原理是先對總體的特徵作出某種假設,然後通過抽樣研究的統計推理,對此假設應該被拒絕還是接受作出推斷。假設檢驗的基本思想是小概率反證法思想。小概率思想是指小概率事件 p 0.01或p 0.05 在一次試驗中基本上不會發...

統計學的假設檢驗

上次寫了統計學裡面的置信度與置信區間以後,文章反響還不錯,這次再來試著寫寫統計學裡面的假設檢驗。假設檢驗的核心其實就是反證法。反證法是數學中的乙個概念,就是你要證明乙個結論是正確的,那麼先假設這個結論是錯誤的,然後以這個結論是錯誤的為前提條件進行推理,推理出來的結果與假設條件矛盾,這個時候就說明這個...

統計學初識之假設檢驗

對於原假設提出的命題,我們需要做出判斷,這種判斷可以用 原假設正確 或 原假設錯誤 來表述。當然這是依據樣本提供的資訊進行判斷的,也就是說由部分來推斷總體。因而判斷有可能正確,也有可能不正確,也就說我們面臨著犯錯誤的可能。所犯的錯誤有兩種型別,一類錯誤是原假設h0為真卻被我們拒絕了,犯這種錯誤的概率...