研究隨機問題時,基本都要用到抽樣**,比較**結果與實驗結果的偏差。
設隨機變數的均值為
μ μ
,方差為 σ2
σ
2,則
n n
個樣本的均值為
μ' role="presentation" style="position: relative;">μ
μ,方差為 σ2
n σ2n
。在給定的置信水平 1−
α 1−α
下, 設樣本的均值為 x¯
¯¯¯ x
¯,其誤差
ε ε
由下列計算公式得出: ε=
|x¯¯
¯¯−μ
| ε=|
x¯−μ
|1. 若
σ σ
已知由於中心極限定理,大量樣本服從正態分佈,樣本的標準差為 σ/
n−−√
σ /n
,根據正態分佈概率的計算公式, φ(
|x¯¯
¯¯−μ
|σ/n
−−√)
=α/2
φ (|
x¯−μ
|σ/n
)=α/
2因此, ε=
|x¯¯
¯¯−μ
|=zα
/2σn
−−√ ε=|
x¯−μ
|=zα
/2σn
可以推出樣本容量
n n
的計算公式為: n=
zα/2
2σ2ε
2' role="presentation" style="text-align: center; position: relative;">n=z
2α/2
σ2ε2
n=zα
/22σ
2ε22. 若
σ σ
未知大部分情況下
σ σ
是未知的,為了消除
σ σ
的影響,有學者引入了
t t
分布,t=
x¯−μ
s/n' role="presentation" style="text-align: center; position: relative;">t=x
¯¯¯¯
−μs/
n−−√
t=x¯
−μs/
n上面這個表示式為 自由度為 n−
1 n−1
的 t t
分布,其中
s' role="presentation" style="position: relative;">s
s為樣本方差,則 ε=
|x¯¯
¯¯−μ
|=tα
(n−1
)sn−
−√ε =|
x¯−μ
|=tα
(n−1
)s
n得到
n n
的計算公式為: n=
tα2(
n−1)
s2ε2
' role="presentation" style="text-align: center; position: relative;">n=t
2α(n
−1)s
2ε2n
=tα2
(n−1
)s2ε
2在樣本容量
n>
30 n
>
30時,置信水平
α<
0.05
α
<
0.05
時,一般可以近似採用下面的計算公式:n=
4s2ε
2 n=4
s2ε2
若樣本容量實在很小,則採用 「試差法」 確定
n n
.參考資料:
1. 2.
統計學 小樣本容量置信區間
一般來講,n 30,不能進行好的估計,針對這種情況,給出t distribution對sample mean分布進行修正。t分布和正態分佈相似,具有fatter tail,因為低估了s。對應的,不再去查z table,而是去查t table。t table的列為自由度degrees of freed...
如何確定抽樣的樣本數量
總體為9200人,預設的整體置信度為95 最大容許誤差為正負5 求樣本容量 網上搜到的第乙個有價值的內容如下 題目某公司對60000人中的吸菸比例做調查,置信度為95 的情況下,若要使誤差保持在4 以內,需要的最小樣本容量是 這裡並沒有告訴總體的方差 標準差 和樣本方差 標準差 那到底應該怎樣做呢?...
怎樣確定常量的型別
在c語言中不僅變數有型別,常量也有型別。為什麼要把常量分為不同的型別呢?在程式 現的常量是要存放在計算機中的儲存單元中的。這就必須確定分配給它多少位元組,按什麼方式儲存。例如,程式中有整數12,在visual c 6.0中會分配給它4個位元組,按補碼方式儲存。怎樣確定常量的型別呢?從常量的表示形式即...