從零開始學統計 11 理解置信區間

2021-10-25 04:37:58 字數 772 閱讀 8512

假設現在測量了12個小鼠體重的值,注意這裡只測量了12只小鼠(樣本),而不是地球上的每乙隻小鼠(總體)

取12個測量值,計算平均值,注意這裡是樣本均值,而不是總體均值(地球上所有小鼠的均值)

理解樣本均值與總體均值:

但是,我們可以通過 bootstrap 方法,確定乙個比較合理的均值範圍來代表小鼠總體均值

現在,選擇95%的bootstrap過程中產生的均值,下面畫一條黑線,這段範圍就是置信區間

因為這個置信區間可以覆蓋 95% 的平均值,除此之外發生的概率只有 5%。換句話說,在置信區間外的p值都小於 0.05,意味著有統計顯著差異。

我們開始的計算的樣本均值,是對所有小鼠總體均值的估計,現在利用置信區間,我們就能知道小鼠總體均值和p值。

綠圈顯示,測量均值落在該區域的概率小於 0.05,p值小於 0.05,說明這幾乎不可能發生。

因此,根據置信區間,我們可以確定總體均值和任意小於20的數值之間在統計上都存在顯著差異。

如果兩個樣本的置信區間有重疊,最好進行統計檢驗,如 t-test 來檢視差異是否顯著。

統計學 置信區間

假設我們想直到1000個人的平均身高。但是對1000人分別進行身高測量太麻煩。所以我們選擇100人樣本進行估計。估計可以是點估計 估計確切身高數 也可以是區間估計 估計確切身高的範圍 區間估計更為科學,所以這裡我們選擇區間估計。要估計就要考慮估計的準確度,我們實現確定95 的估計準確度。95 準確度...

統計學筆記1 置信區間

作為資料科學的重要基礎學科,我開始share統計學的學習筆記。單個正態總體,總體方差已知,均值的置信區間,基於中心極限定理 標準正態分佈,適用於樣本量大的情況 n 100 單個正態總體,總體方差未知,均值的置信區間,基於t分布,適用於樣本量較小的情況 bootstrap,通過數值模擬求置信區間 bo...

如何理解 95 置信區間?

著作權歸作者所有。用於理解的話你可以這樣想 你得出的置信區間就像一張大網,而你要推斷的真值是海浬的一條魚 不動的魚 你的網可以撒向任何地方,有可能能捕捉到那條魚,有可能一無所獲。95 是用來描述你捕獲真值的概率的,你撒100次網,有95次捕到了真值,5次一無所獲。引用一下gudmud r ivers...