先來看個例子:
小明是乙個窮屌絲,喜歡公司的乙個同事小美;同時,小明的上上上級小強是個高富帥,在沒事的時候也經常親自指導小美寫**。小明決定在情人節那天發動攻勢,鼓起勇氣約小美出去玩,小美當時說自己有事,下次吧。後續小明又陸陸續續約了小美10次,小美除了有2次和小明出去,其他時間都說自己有事。那麼問題來了,小美是真的有事還是不想和小明出去?
現實過程中,小美除了這段時間加班或者生病等特殊情況,假設小美出去不出去的概率相等(隨機),那麼這個是乙個非常簡單的二項分布,現實過程中,約小美10次而只出來2次的概率為
c10(
2)*(1/
2)^2*(1/
2)^8
在r語言中是
dbinom
(2,10,0.5)
求出結論=0.0439
這個值的意義是:如果小美出不出來是隨機的話,小明約小美10次有2次出來的概率在4%左右
如果我們認為一般情況下,低於5%的概率一般不會發生,如果某件事情低於5%,就認為其中必定有鬼,那麼在這個case下,小明可以得出,小美其實不是每次隨機碰到了事情,而是她根本不想和我出來!
但是小明就是愛的深沉,抱著總會有人喜歡的幻覺,就不免總有刁民想害朕的思想。5%的概率還是有點高,萬一誤判了小美怎麼辦?這樣再給小美幾次機會,如果概率小到1%以內,我就放棄吧。
從此小明又開始了幾次不成功的約約約,後來小明統計了下,一共約了女神25次,女神出來3次,機智的小明按照之前的方法計算出在小美是隨機遇到事情的前提下概率為
dbinom(3,25,0.5)=0.007%
也就是如果是隨機的話,只有不到1%的概率可以解釋這件事情,小明最後死心了,覺得根本就不是隨機的,而是確定了小美不喜歡自己,遂放棄。
但是反過來小強約了小美25次,小美出來了22次,其實這個概率和小明那個概率相同
dbinom(22,25,0.5)=0.007%
也說明不是隨機的,但是此不隨機和彼不隨機可不一樣,我們有理由相信,小美是因為喜歡小強,才把原本隨機的約會概率變成了不隨機。
ok,現在小明灰心喪氣,不追求小美了,但是看上了公司的交際花小浪,小明約了幾次小浪,小浪都出來陪小明談心,小明一看有戲,一共約了小浪20次,小浪出來15次之多!但是小明的朋友告訴他,小浪比較好約,和別人出去的概率大概是80%,小明想了想,自己和別人相比有沒有什麼特別的地方呢?那麼算一下概率吧!
dbinom(15,20,0.8)=17.5%
也就是說,在小明價值觀認為1%才算不可能事件的前提下,這個概率不能認為小浪對小明和其他人有區別;小明望著前兩天日本**的003,悵然若失。
在小明傷心透頂之時,公司平常不苟言笑的財務助理小花突然安慰起小明來了,小明在這個時候也需要安(a)慰(v),遂經常約小花談心,但是對小明來說也是比較糾結,約了小花10次,小花只出來2次,這和當時約小美的情況簡直一模一樣;正在小明想要放棄之時,同事和小明說小花的母親生病了,平均三個月也就能有一天不用照顧母親在家休息。
小明聽到這個飛快的計算了下:
dbinom(2,10,1/90)=0.51%
在小花這麼艱難的情況下(出來約會的概率為1/90)竟然和自己出來約會了2次,有理由相信,自己終於和別人的地位不一樣了。最後小明和小花過上了快樂的日子。
雖然前面是簡單的二項分布,但是實際情況下可以擴充套件到正態分佈(n趨向於無窮的連續分布),而且由於我們可以判斷結果的大小(小明和小強的例子),其實我們做的是單側檢驗,還有一些實際情況,是判斷相同和不同,這需要雙側檢驗,後續會按照更通俗的例子加以說明。
通俗向 假設檢驗(二) 檢驗
還是看乙個栗子 小明想了想在企業裡上班沒啥意思,還是出來報效祖國當兵吧,於是告別了心愛的小花,去了某陸軍學校準備深造。但是看到當兵要求,發現非常嚴格的指明體重只要90kg以下,上下不能超過2kg,小明看了看自己的體重,95kg感覺沒戲了,但是天無絕人之路,對於當兵的體重只是抽查,因為也實在沒有那麼多...
假設檢驗 假設檢驗學習筆記
在實際工作和研究中,往往只能獲得資料的一部分,通常指這個資料為樣本,而通過樣本對整體的估計被稱為假設檢驗。樣本是從整體中選取的較小集合,中心極限定律 樣本的均值約等於總體的均值 不管整體什麼分布,任意乙個總體的樣本均值都會圍繞在總體的均值周圍,且呈正太分布。關鍵資訊 樣本的均值等於總體的均值 樣本的...
假設檢驗 到底該怎麼理解假設檢驗?
學過統計學或概率論的同學,對 假設檢驗 這個詞一定不陌生。因為期末考試的卷子裡必定會考一道這種題,那個時候,我其實對假設檢驗的流程並不是很理解,不過幸好流程簡單,照葫蘆畫瓢,套一套格式就能答對。那假設檢驗到底是個什麼東西?先上一道假設檢驗的例題,回憶一下假設檢驗的流程,找一下當初的感覺。某工具機廠加...