設樣本均值為
,樣本方差為
,總體均值為
,總體方差為
,那麼樣本方差
有如下公式:
很多人可能都會有疑問,為什麼要除以n-1,而不是n,但是翻閱資料,發現很多都是交代到,如果除以n,對樣本方差的估計不是無偏估計,比總體方差要小,要想是無偏估計就要調小分母,所以除以n-1,那麼問題來了,為什麼不是除以n-2、n-3等等。所以在這裡徹底總結一下,首先交代一下無偏估計。
無偏估計
以例子來說明,假如你想知道一所大學裡學生的平均身高是多少,乙個大學好幾萬人,全部統計有點不現實,但是你可以先隨機挑選100個人,統計他們的身高,然後計算出他們的平均值,記為
。如果你只是把
作為整體的身高平均值,誤差肯定很大,因為你再隨機挑選出100個人,身高平均值很可能就跟剛才計算的不同,為了使得統計結果更加精確,你需要多抽取幾次,然後分別計算出他們的平均值,分別記為:
然後在把這些平均值,再做平均,記為:
,這樣的結果肯定比只計算一次更加精確,隨著重複抽取的次數增多,這個期望值會越來越接近總體均值
,如果滿足
,這就是乙個無偏估計,其中統計的樣本均值也是乙個隨機變數,
就是的乙個取值。無偏估計的意義是:在多次重複下,它們的平均數接近所估計的引數真值。
介紹無偏估計的意義就是,我們計算的樣本方差,希望它是總體方差的乙個無偏估計,那麼假如我們的樣本方差是如下形式:
那麼,我們根據無偏估計的定義可得:
由上式可以看出如果除以n,那麼樣本方差比總體方差的值偏小,那麼該怎麼修正,使得樣本方差式總體方差的無偏估計呢?我們接著上式繼續化簡:
(var(x^)為什麼等於σ2/n?推導公式:d(x把)=d(1/n∑xi)=1/n²d(∑xi)=1/n²∑d(xi)=(1/n²)nσ²=σ²/n )
到這裡得到如下式子,看到了什麼?該怎修正似乎有點眉目。
如果讓我們假設的樣本方差
乘以,即修正成如下形式,是不是可以得到樣本方差是總體方差
的無偏估計呢?
則:
因此修正之後的樣本方差的期望是總體方差
的乙個無偏估計,這就是為什麼分母為何要除以n-1。
無偏方差為什麼除以n 1
設樣本均值為 樣本方差為 總體均值為 總體方差為 那麼樣本方差 有如下公式 很多人可能都會有疑問,為什麼要除以n 1,而不是n,但是翻閱資料,發現很多都是交代到,如果除以n,對樣本方差的估計不是無偏估計,比總體方差要小,要想是無偏估計就要調小分母,所以除以n 1,那麼問題來了,為什麼不是除以n 2 ...
徹底理解樣本方差為何除以n 1
設樣本均值為 很多人可能都會有疑問,為什麼要除以n 1,而不是n,但是翻閱資料,發現很多都是交代到,如果除以n,對樣本方差的估計不是無偏估計,比總體方差要小,要想是無偏估計就要調小分母,所以除以n 1,那麼問題來了,為什麼不是除以n 2 n 3等等。所以在這裡徹底總結一下,首先交代一下無偏估計。無偏...
為什麼樣本方差除以(n 1)而不是n (自由度)
不記得第幾次看見樣本方差的公式,突然好奇為什麼要除以 n 1 而不是n呢?看見一篇文章從定義上和無偏估計推導上講的很清楚書上看見從自由度上作的解釋,在此記錄一下。自由度自由度是統計學中乙個經常見到的重要概念。指計算某一統計量時,取值不受限制的變數個數。對於樣本方差來說,自由度為n 1。s2的表示式中...