作為資料科學的重要基礎學科,我開始share統計學的學習筆記。
單個正態總體,總體方差已知,均值的置信區間,基於中心極限定理、標準正態分佈,適用於樣本量大的情況(n>100)
單個正態總體,總體方差未知,均值的置信區間,基於t分布,適用於樣本量較小的情況
bootstrap,通過數值模擬求置信區間
bootstrap演算法:
已知資料x1...xn,置信水平a(比如95%),模擬的總次數n
n次模擬中的每一次模擬:從x1...xn中有放回地抽取n個,算它們的平均值yi,最終得到y1...yn
算出y1...yn的兩個分位數,分位數對應的位置是(1-a)/2和(1+a)/2(比如0.025和0.975),就是區間端點
library(stats)
x=c(160.2,160.8,161.4,162,160.8,162,162,161.8,161.6,161.8)
n=10000
a=0.95
y=rep(0,n)
for (i in 1:n)
ci=quantile(y,probs=c((1-a)/2,(1+a)/2))
hist(y,breaks=20)
abline(v=ci[1],col='red',lty=3)
abline(v=ci[2],col='red',lty=3)
以上是r語言**示例。 統計學 置信區間
假設我們想直到1000個人的平均身高。但是對1000人分別進行身高測量太麻煩。所以我們選擇100人樣本進行估計。估計可以是點估計 估計確切身高數 也可以是區間估計 估計確切身高的範圍 區間估計更為科學,所以這裡我們選擇區間估計。要估計就要考慮估計的準確度,我們實現確定95 的估計準確度。95 準確度...
統計學 小樣本容量置信區間
一般來講,n 30,不能進行好的估計,針對這種情況,給出t distribution對sample mean分布進行修正。t分布和正態分佈相似,具有fatter tail,因為低估了s。對應的,不再去查z table,而是去查t table。t table的列為自由度degrees of freed...
征服統計學10 什麼是95 置信區間?
本文介紹置信區間 confidence interval,ci的自舉法計算及其意義。自舉法計算置信區間 自舉法獲採樣本均值 計算置信區間 置信區間存在意義 作用一 同一組樣本劃定可以估計總體的區間 作用二 兩組樣本差異直接比較 置信區間 confidence interval,ci 比較容易理解的計...