乙個優秀的色子被擲出的時候,必然是等概率的出現各個面的,即每個點都有1/6的可能性出現。
如果乙個人摸出倆色子,跟你猜大小,你怎知道這倆色子有沒有被做過手腳?如果不把色子切開看,怎麼能知道這個色子的質地是否均勻分布?是否等概率的出現大小點呢?
假設檢驗可以幫到我們。
假設檢驗說起來很簡單:我們針對隨機的事件,提出乙個假設。好比色子大、小點等概率出現。然後對上面的假設進行檢驗。多擲幾次看看和前面假設的結果是否匹配。
假設檢驗(hypothesis testing),又稱統計假設檢驗,是用來判斷樣本與樣本、樣本與總體的差異是由抽樣誤差引起還是本質差別造成的統計推斷方法。上面這段話是依據看上去很正確的廢話,因為正常人很難看得懂。假設檢驗,說的直白點,就是利用「小概率事件"原理。
還是以擲色子為例,好了,我假設你的色子沒問題。我扔一下是大,50%的概率,沒問題;如果再扔一下還是大,25%,好吧,可能手氣太好了;連著又扔了5下,都是大。這就讓我很有理由懷疑你的色子是有問題的。
從上面這個例子我們看出來了,我們利用小概率事件在一次實驗中幾乎不發生這件事來對我們的假設進行證反。
再舉乙個例子,好比我們假設某個地區的平均身高是1.7公尺,而乙個地區人的身高是服從正態分佈的。那麼超過兩公尺的人出現的概率是很小的,如果你在這個地區逛街,乙個下午就碰到幾個超過兩公尺的人,那麼你就有充分的理由懷疑你前面關於這個地區平均身高1.7公尺這個假設太低了。
如果我們只是像前面那樣憑感覺來做事,那就太不數學了。我們需要乙個數值的東西和一些數學公式來精準的指導我們做假設檢驗這件事。p值這個概念就可以勝任這個事。
p值說的是什麼呢?還是以擲色子為例,我們假設出現大、小點的概率是等同的。那麼我們來擲10次色子,這10次投遞出現8次大的概率p8、出現9次大的概率p9,出現10次大的概率p10,我們把這三個概率給加起來得到的乙個值,我就叫p值。如果這個p值很小,但是它這個事件卻真實發生了,我們就有理由懷疑前面的假設是錯誤的。
當然你也可以拿9次、10次大的概率相加得到乙個p-value。
p值不一樣,我們推翻前面假設的信心也不一樣。p值越小的事件發生,我們推翻假設的信心越強。
如果p<0.01,說明是較強的判定結果,拒絕假定的引數取值。
如果0.01如果p值》0.05,說明結果更傾向於接受假定的引數取值。
關注我。
假設檢驗 假設檢驗學習筆記
在實際工作和研究中,往往只能獲得資料的一部分,通常指這個資料為樣本,而通過樣本對整體的估計被稱為假設檢驗。樣本是從整體中選取的較小集合,中心極限定律 樣本的均值約等於總體的均值 不管整體什麼分布,任意乙個總體的樣本均值都會圍繞在總體的均值周圍,且呈正太分布。關鍵資訊 樣本的均值等於總體的均值 樣本的...
假設檢驗 到底該怎麼理解假設檢驗?
學過統計學或概率論的同學,對 假設檢驗 這個詞一定不陌生。因為期末考試的卷子裡必定會考一道這種題,那個時候,我其實對假設檢驗的流程並不是很理解,不過幸好流程簡單,照葫蘆畫瓢,套一套格式就能答對。那假設檢驗到底是個什麼東西?先上一道假設檢驗的例題,回憶一下假設檢驗的流程,找一下當初的感覺。某工具機廠加...
(六)假設檢驗
假設檢驗的步驟 步驟1 提出原假設與備擇假設 步驟2 指定檢驗中的顯著性水平 步驟3 蒐集樣本資料並計算檢驗統計量的值 p 值方法 步驟4 利用檢驗統計量的值計算p 值 步驟5 如果p 值 a,則拒絕h0 臨界值方法 步驟6 顯著性水平確定臨界值以及拒絕規則 步驟7 利用檢驗統計量的值以及拒絕規則確...