怎樣構建置信區間?
構建置信區間,一般有下面四個步驟:
選擇總體統計量
也就是說,我們希望為那個統計量構建置信區間。常見的如均值和比例。比如身高平均值、藥效持續時長、**率等。選擇好統計量,則可以開始進行下一步。
求出所選統計量的抽樣分布
為了求出統計量的抽樣分布,需要知道其期望、方差以及分布。以均值為例(我們構建總體均值的置信區間),我們知道對於均值抽樣分布(推導過程,詳見前文鏈結):
知道了期望和方差,下面就需要知道抽樣分布了。我們知道,根據中心極限定理,當樣本很大的時候,均值抽樣分布符合正太分布。那如果樣本比較小的時候呢?答案是:當樣本比較小的時候,均值抽樣分布符合t分布。用數學方法表示就是:
樣本很大的時候,。這裡,儘管我們不知道總體的方差,但可以用總體方差的點估計量來估計。因此,改寫為:
樣本比較小的時候,。這裡,v是表示自由度,且,其中n為樣本大小。(這裡不對t分布做更多的討論)
3. 決定置信水平
置信水平表明,我們有多大的信心使得總體統計量位於區間(a, b)內。常用的置信水平是95%,需要注意的是:置信水平越高,區間越寬,置信區間包含總體統計量的機率也就越大。但是如果置信區間過大,就會失去其意義。舉例來說,「某個地區男性的平均身高介於100cm和200cm之間」,這個概率幾乎可以說是100%,但是這樣的論斷,完全沒有實際的意義。現在確定了置信區間,最後就剩下求解置信上下限了。
求出置信上下限
這裡分別來看下,當均值抽樣分布符合正太分布和t分布的時候,如何求解。
均值抽樣分布符合正太分布,且置信水平為95%時:
我們已知,將其標準化後得到:
查表可得: 當時,;當時,。因此,我們需要求解下面的不等式,其中用均值點估計量替換,用方差點估計量替換:
到此為止,就求出了置信水平為95%下的置信區間為:
均值抽樣分布符合t分布,且置信水平為95%時:
我們已知,將其標準化後得到:
求解時,我們將和分別用均值和方法的點估計量代入即可。類似的,變換不等式則可以求出置信區間為:,其中t通過查表得出。
置信區間 confidence interval
置信區間 find an interval such that reasonbly confident that were is a 95 chance that the true p x sampling distribution of the sample mean mean of the sa...
95 置信區間
置信區間在spss裡可以通過描述 探索獲得 1.樣本容量大於30 根據中心極限定律以及正態分佈 z table 95 置信區間的範圍基本等於 sample mean 2 樣本均值的抽樣分布的標準差 這裡,sample mean是觀測到的,2 是查正態分佈z table表得出,而樣本均值的抽樣分布的標...
置信區間與置信度
本文簡要介紹了置信區間這一核心概念,它有助於我們從直觀上理解評價估計優劣的度量方法。假設你想知道美國有多少人熱愛足球。為了得到 100 正確的答案,你可以做的唯一一件事是向美國的每一位公民詢問他們是否熱愛足球。根據維基百科,美國有超過 3.25 億的人口。與 3.25 億人談話並不現實,因此我們必須...