置信區間 confidence interval

2021-08-06 02:06:27 字數 1600 閱讀 5505

置信區間:

find an interval such that 「reasonbly confident」 that were is a 95% chance that the true

μ (=p

=μx¯

)sampling distribution of the sample mean

μ :mean of the」sampling distribution of the sample mean」 σx

¯ : variance of the 「sampling distribution of the sample mean」

一般是有這個「sample mean」的distribution後,

就有了與標準正太分布做比較的依據。

z-score就是一種尺度,z-score=x−

μσx¯

, 通過z表對應值即可找出置信區間。

例如,常說的,有95%的可能,population的均值出現在μ±

2σx¯

中,也就是z-score=2.0時,查標準正態分佈表,值為0.9772,

於是置信區間為2*(0.9772-0.5)=0.9544,常約等於0.95而μ

與σx¯

,則是通過做調查的樣本估計得到的。

例如,某一地區投票選舉,候選人為張三,李四。為了估計整個地區對二者的支援率為多少,我們隨機抽取100人做調查,發現57人支援張三,43人支援李四。

為了讓事件能夠進行數學計算,我們把「支援張三」當做1,把「支援李四」當做0。

於是我們從這份樣本中計算出均值x¯

=1∗57

+0∗43

100=

0.43

,方差s2

=57∗(

1−0.43)2

+43∗(

0−0.43)2

100−1=

0.2475 s

=0.5

,因此,我們就用計算出來的s作為總體variance的估計,σ=

s (約等於)

為什麼用100-1

用100去除的話,得到的是biased estimate of population variance,就是有偏差的估計,經過大量模擬可以得出用n-1作為除數是偏差最小的估計,而如果用n-2的話,則估計值會偏大。或者用嚴謹的數學公式也能證明

於是,我們就能由我們選取的乙個樣本計算出的值來估計samping distribution of sample mean中的值, μx

¯=x¯

σx¯=σn−

−√當然,這樣的估計是有偏差的,而margin error=2σ

x¯,即選取的樣本越大,就是n越大,margin error越小。

我們可以得出μx

¯=x¯

=0.43σx

¯=σn

√=0.05ma

rgin

erro

r=0.1

於是,最後我們得出結論,我們有95%的把握,該地區的所有人對張三的支援率為33%~53%(μx

¯±2σ

x¯)之間,而margin error為10%

95 置信區間

置信區間在spss裡可以通過描述 探索獲得 1.樣本容量大於30 根據中心極限定律以及正態分佈 z table 95 置信區間的範圍基本等於 sample mean 2 樣本均值的抽樣分布的標準差 這裡,sample mean是觀測到的,2 是查正態分佈z table表得出,而樣本均值的抽樣分布的標...

置信區間與置信度

本文簡要介紹了置信區間這一核心概念,它有助於我們從直觀上理解評價估計優劣的度量方法。假設你想知道美國有多少人熱愛足球。為了得到 100 正確的答案,你可以做的唯一一件事是向美國的每一位公民詢問他們是否熱愛足球。根據維基百科,美國有超過 3.25 億的人口。與 3.25 億人談話並不現實,因此我們必須...

python計算置信區間

python 置信區間 置信區間是指由 樣本統計量 所構造的總體引數的估計區間。這句話也就是說 這裡統計量一般指均值 利用樣本均值來估計總體均值的可靠程度,這個 可靠程度 用 置信區間 來表示,置信區間 是乙個係數 取值範圍為 0 置信區間 1 這個置信區間就是用來描述真實的均值發生在某範圍的概率 ...