不記得第幾次看見樣本方差的公式,突然好奇為什麼要除以(n-1)而不是n呢?看見一篇文章從定義上和無偏估計推導上講的很清楚書上看見從自由度上作的解釋,在此記錄一下。
自由度自由度是統計學中乙個經常見到的重要概念。指計算某一統計量時,取值不受限制的變數個數。
對於樣本方差來說,自由度為n-1。s2的表示式中
為n個量的平方和,為何自由度只有n-1?因為x1-
, ... , x2-
這n個量並不能自由變化,而是受到乙個約束,即
,這使它的自由度少了乙個,在樣本方差s2的公式中分母上是n-1,就是因為當給定均值
時,x1, x2, ..., xn這n個資料中,前n-1個資料都可以自由取值,而第n個資料受到全部資料的平均值
的約束,不能自由取值。第n個資料可由公式
求得,因此,s2的自由度是n-1。所以,所謂「自由度」就是指可以自由取值的資料的個數,或者指不受任何約束,可以自由變動的變數的個數。
還可以對自由度這個概念賦予另一種解釋,即一共有n個資料,有n個自由度,用s2估計總體方差σ2,自由度本應為n,但總體均值μ也未知,用
去估計,用掉了乙個自由度,故只剩n-1個自由度。
用矩陣秩的概念也可以解釋自由度。自由度是對隨機變數的二次型(可稱為二次統計量)而言的,自由度就是二次型矩陣的秩。但用矩陣的秩來判斷統計量的自由度比較困難,一般採用直觀方法來做判斷,即由線性代數知識可知,乙個二次型的秩為它所含變數個數減去變數間獨立線性約束條件的個數,從而便可得到統計量的自由度。關於樣本方差s2的自由度,就是因為
含有n個變數,但n個變數有乙個線性約束條件
,故s2的自由度為n-1。
回歸分析中,回歸方程的顯著性檢驗用到殘差平方和。確定殘差平方和的自由度的一般方法是:觀測值的個數n減去必須估計出的引數的個數就是自由度。例如p元線性回歸方程的殘差平方和的自由度就是n-p-1,因為回歸方程中有p+1個待估引數。
樣本均值方差為什麼除以n 1
設樣本均值為 樣本方差為 總體均值為 總體方差為 那麼樣本方差 有如下公式 很多人可能都會有疑問,為什麼要除以n 1,而不是n,但是翻閱資料,發現很多都是交代到,如果除以n,對樣本方差的估計不是無偏估計,比總體方差要小,要想是無偏估計就要調小分母,所以除以n 1,那麼問題來了,為什麼不是除以n 2 ...
無偏方差為什麼除以n 1
設樣本均值為 樣本方差為 總體均值為 總體方差為 那麼樣本方差 有如下公式 很多人可能都會有疑問,為什麼要除以n 1,而不是n,但是翻閱資料,發現很多都是交代到,如果除以n,對樣本方差的估計不是無偏估計,比總體方差要小,要想是無偏估計就要調小分母,所以除以n 1,那麼問題來了,為什麼不是除以n 2 ...
徹底理解樣本方差為何除以n 1
設樣本均值為 很多人可能都會有疑問,為什麼要除以n 1,而不是n,但是翻閱資料,發現很多都是交代到,如果除以n,對樣本方差的估計不是無偏估計,比總體方差要小,要想是無偏估計就要調小分母,所以除以n 1,那麼問題來了,為什麼不是除以n 2 n 3等等。所以在這裡徹底總結一下,首先交代一下無偏估計。無偏...