我們現在課本上所提供的方差的計算方式,這個分母是除以n,有一些統計學書中,方差的乙個計算公式分母是除以的n-1。
一般計算器上,兩個公式都有。為什麼會有這樣的差異,這兩個公式哪個對,哪個錯,還是都有道理?
我們先看乙個例子。現在有10000個燈泡,那麼它有乙個方差,這個方差是乙個總體方差。如果我們抽了這個總體中的1000個燈泡去計算方差,並且用它去估計總體的那個方差,如果要除以n的話呢,在理論上可以證明,用除以n的來估計總體,它的估計是偏低的,也就是說我們算出來的樣本方差比總體方差要低。要除以n-1的話,就不偏低,所以除以n-1好,這是理論上的問題。
我們用乙個資料來估計總體時,要有乙個標準,就是說估計得好還是不好。比如說要估計這個總體方差,用誰來來估計。用第乙個公式算出來的樣本方差是估計,用第二個公式算出來的樣本方差也是估計,都是估計,好還是不好,首先就要看你給出乙個什麼叫好,什麼叫不好的標準,如果你認為它偏低或者偏高都不好的話,那麼標準就是要估計得無偏,就是說認為無偏估計是好,理論上已經證明了除以n-1就要比除以n要好;當然還可以有別的標準,比如說靠得越近就好,這時除以n就好,這在統計學中稱為極大似然估計。因此標準不一樣,好壞也就不一樣。
教材裡選用n,還有乙個就是比較自然,顧及到學生的可接受性,因為n個數求算術平均數時除以的是n,再學習計算方差的公式,除以n接受起來比較自然,比較方便。要除以n-1的話,我們還需要給學生解釋,或者是介紹更多的內容去理解為什麼要減去這個1。老師們可以根據自己學生的能力水平,是否去介紹這種新的公式。而且當這個數很大的話,比如除以10000跟除以9999,得到的那個資料結果,差異很小很小。所以,當n很大時,兩個都可以。當然n很小時,除以n-1,還是除以n還是有差異的,但這不是乙個什麼太本質的問題。
也可以這樣來理解:
計算樣本方差時先要對均值x作乙個估計,占用了乙個自由度。也就是說,用剩下的任意n-1個資料與x放在一起就可以計算方差,即只有n-1個自由度。但為了計算簡便,還是把n個資料都放進了公式,但並沒有增加自由度,所以只能除以n-1。
將幾個樣本的方差合併為總體方差估計時,比如乙個樣本的大小是m,方差為s1,另乙個樣本大小是n,方差為s2,對總體方差的無偏估計是[(m-1)s1+(n-1)s2]/(m+n-2),合併時的分母是(m-1)+(n-1)=m+n-2而不是m+n-1,這是按自由度的演算法。
無偏性可通過樣本大小為1的極端情形來考察,這乙個資料是對均值的估計,但計算方差時沒有自由度了,實際上就不能估計方差,公式退化成0/0型,沒有意義才是真的有意義,如果除以1,則方差估計值為0,反而不如0/0能反映真實含義。
統計學 方差分析
單因素方差分析 問題 行業不同是否影響被投訴次數?說明 零售業對應列的7個資料是七個不同 零售業的 公司各自的被投訴次數,其他行業及其資料類似。使用excel進行單方差分析 首先在excel中新增載入項 資料分析 資料 選項卡,分析 資料分析 對話方塊,選擇 方差分析 單因素方差分析 在對話方塊設定...
統計學之方差分析
方差分析 analysis of variance,簡稱anova 是用於兩個及兩個以上樣本均數差別的顯著性檢驗。方差分析中,由於各種因素的影響,研究所得的資料呈現波動狀,這種波動可以分為組間波動和組內波動兩種情況。單因素方差分析 食物1食物2食物335 5236 147均值 2 均值 4 均值 6...
統計學基礎之方差分析
一 基本概念 二 型別 1 單因素方差分析 2 雙因素方差分析 3 協方差分析 一 基本概念 方差分析又稱 變異數分析 或 f檢驗 用於兩個及兩個以上樣本均數差別的顯著性檢驗。1 實驗條件,即不同的處理造成的差異,稱為組間差異。用變數在各組的均值與總均值之偏差平方和的總和表示,記作ssb,組間自由度...