誤差永遠存在,而且不可避免。即使實驗條件再精確也無法完全避免隨機干擾的影響,所以做科學實驗往往要測量多次,用取平均值之類的統計手段去得出結果。
多次測量,是乙個排除偶然因素的好辦法。如國足輸掉比賽之後經常抱怨偶然因素,有時候是因為裁判不公,有時候是因為主力不在,有時候是因為不適應客場氣候,關鍵是如果你經常輸球,我們還是可以得出你是個弱隊的結論。而國際足聯的世界排名,是根據各國球隊多次比賽的成績採用加權平均的辦法統計出來的,這個排名比一兩次比賽的勝負,甚至世界盃賽的名次更能說明球隊的實力。但即便如此,我們也不能說國際足聯的排名就是各個球隊的「真實實力」。這是因為各隊畢竟只進行了有限次數的比賽,再好的統計手段,也不可能把所有的偶然因素全部排出。
所以,在科學實驗中總是會在測量結果上加乙個誤差範圍。比如經過測量馬雲的智商是100,測量誤差是±5。這句話的意思是說,馬雲智商是100,但其中有正負5的統計誤差,所以馬雲的智商範圍就是[100-5,100+5]這麼乙個範圍。
真實的智商值當然只有乙個,但是這個數是多少,我們不知道,它可以是這個誤差範圍內的任何乙個數字。
考試成績也如此,假設乙個同學考了兩次才過英語四級,第一次53分,第二次63分。他說這是略有進步,我說你這不叫進步,叫都在測量誤差範圍之內。
這裡的誤差範圍(區間)在統計概率中就叫做置信區間。簡單來說,置信區間就是誤差範圍。
比如我用一定量的樣本資料估計出全體知乎使用者的平均年齡為28歲。如果你收集了另外
一組樣本,其平均年齡為35歲,是否能判斷我前面的估計是錯誤的呢?
因為我們沒辦法知道總體平均數的真實數值,所以,我們需要給出乙個誤差範圍來描述這個估計的準確程度。
我們用中括號[a,b]表示樣本估計總體平均值的誤差範圍的區間,由於a和b的確切數值取決於你希望自己對於「該區間包含總體均值」這一結果具有的可信程度,因此,[a,b]被稱為置信區間。
同時,我們選擇這個置信區間,目的是為了讓「a和b之間包含總體平均值」這一結果具有特定的概率,這個概率就是置信水平。
假設我設定的置信水平是95%,也就是說如果我做100次抽樣,得到100個置信區間,會有95個置信區間包含了總體平均值。(參考於計量經濟學及stata應用陳強)
而對於某一次計算得到的某乙個置信區間(點估計),其包含真值的概率,我們無法討論。
置信區間是我們所計算出的變數存在的範圍,置信水平就是我們對於這個數值存在於我們計算出的這個範圍的可信程度。
舉例來講,有百分之九十五的把握,真正的數值在我們所計算出的範圍裡。在這裡,百分之九十置信水平,而我們計算出的範圍,就是置信區間。
可信度:可信度越大,區間越寬
個體變異(標準差):變異越大,區間越寬
樣本含量:樣本含量越大,區間越窄
可信區間一旦形成,它要麼包含總體引數,要麼不包含總體引數,二者必居其一,無概率可言。所謂95%的可信度是針對可信區間的構建方法而言的。
以均數的可信區間為例,其涵義是:如果重複100次抽樣,每次樣本含量均為n,每個樣本均數
在區間估計中,總體引數雖未知,但卻是固定的值(且只有乙個),而不是隨機變數值。
算得某95%的可信區間,則:
——總體引數有95%的可能落在該區間。(錯)
——有95%的總體引數在該區間內。(錯)
——該區間包含95%的總體引數。(錯)
——該區間有95%的可能包含總體引數。(錯)
——該區間包含總體引數,可信度為95%。(對)
解析:1、總體引數有95%的可能落在該區間
答:錯。總體引數,只有乙個,是固定不變的。變化的是你的區間。「總體均數有95%的可能在某範圍」,「總體引數有95%的可能落在該區間」,兩者的區別在於前者的說法可以翻譯為「該區間有95%的可能包含總體引數」,而後者中的動詞是「落在」,「落在」的話代表總體均數是可能變化的,但是總體均數確確實實是固定的。
2、在95%置信區間內有95%的總體引數在該區間?答:錯。總體引數只有乙個。
3、在95%置信區間內,該區間包含了95%的總體引數?答:錯。總體引數只有乙個。
4、在95%置信區間,該區間有95%的可能包含總體引數?總體引數有95%的可能在該區間?
答:錯。是按照95%的可信度推測總體引數在這個區間內。不能講總體均數在區間的可能性是95%,因為總體均數是乙個固定值,沒有概率可言,在區間裡的可能只有0和100%。只能說總體均數在該區間內,這個結論正確的可能性是95%。
5、該區間包含總體引數,可信度為95%。
答:對。置信區間的概念是按一定的概率或可信度(1-α)用乙個區間來估計總體引數所在的範圍。對這句話的翻譯就是:有百分之九十五的把握,真正的數值在我們所計算出的範圍裡。
乙個區間有(1-a)的把握包含總體引數,反過來說,就是該區間包含總體引數,可信度為95%。
另外還有一種說法,置信水平是95%,也就是說如果我做100次抽樣,得到100個置信區間,會有95個置信區間包含了總體平均值。
6、總體均數有95%的可能在某範圍內,如下圖
答:b因為它講的是在某範圍內,這個某範圍可以理解為乙個固定的,已經得到的95%ci,所以b符合可信區間的定義。但是如果換成「落在」該區間,這個概念就不對了,因為主體從區間變成引數了。
可信區間用於估計總體引數,總體引數只有乙個。
參考值範圍用於估計變數值的分布範圍,變數值可能很多甚至無限。
95%的可信區間中的95%是可信度,即所求可信區間包含總體引數的可信程度為95%
95%的參考值範圍中的95%是乙個比例,即所求參考值範圍包含了95%的正常人。
都是變異指標。
當n不變時,標準差↑,標準誤↑區別:
標準差描述原始資料的離散程度;
標準誤反映均數的抽樣誤差大小。
標準差衡量樣本均數對原始資料的代表性,標準差越小,樣本均數對原始資料的代表性越好;
標準誤衡量樣本均數估計總體均數的精確性,標準誤越小,樣本均數估計總體均數精度越高。
當n→n時,樣本標準差→總體標準差
當n→n時,標準誤→0
結合樣本均數和正態分佈的規律,標準差估計參考值範圍;
結合樣本均數和t分布的規律,標準誤估計總體均數的可信區間。
【延申】概念辨析
標準差vs標準誤
個體變異vs抽樣誤差
參考值範圍vs可信區間
變數分布vs抽樣分布
求總體標準差的置信區間 如何計算置信區間
一 置信區間與置信水平 在做實驗時,即使實驗條件再準確,也無法避免隨機干擾的影響,所以誤差永遠存在,無可避免。做科學實驗時要測量多次,採取取平均值的方法。在科學實驗的測量結果上,總是會加上乙個測量範圍。統計學核心思想 用樣本資訊來估計總體資訊 之前我們用樣本給出乙個精確值來估計總體,這個點估計值是有...
置信區間 confidence interval
置信區間 find an interval such that reasonbly confident that were is a 95 chance that the true p x sampling distribution of the sample mean mean of the sa...
95 置信區間
置信區間在spss裡可以通過描述 探索獲得 1.樣本容量大於30 根據中心極限定律以及正態分佈 z table 95 置信區間的範圍基本等於 sample mean 2 樣本均值的抽樣分布的標準差 這裡,sample mean是觀測到的,2 是查正態分佈z table表得出,而樣本均值的抽樣分布的標...