表示試驗次數無窮大時,樣本均值就等於總體均值。
$x_1,x_2,x_3,...$是相互獨立,服從期望$e(x_k) = \mu$分布的隨機變數,則對於任意$\epsilon>0$,有:
$\displaystyle \lim_p\left\\sum\limits_^x_k - \mu\right|<\epsilon\right\} = 1$
是辛欽大數定律的推論(其實就是乙個特例),$f_a$是$n$次重複試驗中事件$a$發生的次數,$p$是每次試驗$a$發生的概率,對於任意$\epsilon>0$,有:
$\displaystyle \lim_p\left\ - p\right|<\epsilon\right\} = 1$
對於服從同一分布的相互獨立隨機變數$x_1,x_2,x_3,...$,期望和方差分別為$e(x_k) = \mu, d(x_k)=\sigma^2>0$,則他們均值的標準化變數
$\displaystyle y_n = \frac\sum\limits_^x_k-e(\frac\sum\limits_^x_k)}\sum\limits_^x_k)}} = \frac\sum\limits_^x_k-\mu}} = \frac-\mu}} $
的分布函式$f_n(x)$對於任意$x$滿足:
$\displaystyle \lim_f_n(x) = \lim_p\left\-\mu}}\leqslant x\right\} = \int _^ \frac} e^t = \phi(x)$
也就是說,當抽樣無窮大且各個抽樣相互獨立時,任何分布的標準化樣本均值都服從標準正態分佈。其實,在樣本量比較大時,直接就把樣本均值的分布看成正態分佈就完事了。這樣一來也可以用$t$分布了:
$\displaystyle \frac-\mu}} \sim t(n-1)$
書中沒有給出證明,直觀感受一下。抽樣無窮大時,樣本均值無限接近於總體均值也就是期望,樣本均值的方差無限接近於0。這樣一來,最後樣本均值的分布和原本的分布沒關係也就理所當然了。
實際上就是,對於分別服從不同分布的相互獨立隨機變數$x_1,x_2,x_3,...$,他們的均值標準化後也服從標準正態分佈。
這是獨立同分布的中心極限定理的特殊情況,也就是當這個分布是二項分布時,而其中的$x_k$只能取值為0或1。所以按照式子,對於期望是$p$的二項分布而言,有:
$\displaystyle \lim_p\left\-p}/\sqrt}\leqslant x\right\} = \phi(x)$
也就是說,當二項分布抽樣無窮大時,抽中1的頻率的分布標準化後服從標準正態分佈。
中心極限定理和大數定律
1.任何乙個樣本的平均值將會約等於其所在總體的平均值 2.不管總體是什麼分布,任意乙個總體的樣本平均值都會圍繞在總體的平均值周圍,並呈正態分佈。作用 1.在沒有辦法得到總體全部資料的情況下,我們可以用樣本來估計總體 例如 美國 民意調查 2.根據總體的平均值和標準差,判斷某個某個樣本是否總體。3 準...
第五章 大數定律及中心極限定理
依概率收斂的定義 伯努利大數定律 對序列的算術平均1n k 1n xk,0 frac1n sum limits nx k,forall varepsilon 0 n1 k 1 n x k 0有lim n p 1 lim limits p nx k mu big varepsilon 1 n lim ...
中心極限定理 講講中心極限定理
今天我們來聊聊統計學裡面比較重要的乙個定理 中心極限定理,中心極限定理是指 現在有乙個總體資料,如果從該總體資料中隨機抽取若干樣本,重複多次,每次抽樣得到的樣本量統計值 比如均值 與總體的統計值 比如均值 應該是差不多的,而且重複多次以後會得到多個統計值,這多個統計值會呈正態分佈。還是直接來看例子吧...