python 計算t分布的雙側置信區間

2022-09-25 20:54:12 字數 1598 閱讀 7941

如下所示:

interval=stats.t.interval(a,b,mean,std)

a:置信水平

b:檢驗量的自由度

mean:樣本均值

std:樣本標準差

from scipy import stats

import numpy as np

x=[10.1,10,9.8,10.5,9.7,10.1,9.9,10.2,10.3,9.9]

x1=np.array(x)

mean=x1.mean()

std=x1.std()

interval=stats.t.interval(0.95,len(x)-1,mean,std)

interval

out[9]: (9.531674678392644, 10.56832www.cppcns.com5321607357)

補充:用python學www.cppcns.com分析 - t分布

1. t分布形狀類似於標準正態分佈

2. t分布是對稱分布,較正態分佈離散度強,密度曲線較標準正態分佈密度曲線更扁平

3. 對於大型樣本,t-值與z-值之間的差別很小

- t分布糾正了未知的真實標準差的不確定性

- t分布明確解釋了估計總體方差時樣本容量的影響,是適合任何樣本容量都可以使用的合適分布

- 根據小樣本來估計呈正態分佈且方差未知的總體的均值

- 對於任何一種樣本容量,真正的平均值抽樣分布是t分布,因此,當存在疑問時,應使用t分布

- 當樣本容量在 30-35之間時,t分布與標準正態分佈難以區分

- 當樣本容量達到120時,t分布與標準正態分佈實際上完全相同了

- 樣本方差使用乙個估計的引數(平均值),所以計算置信區間時使用的t分布的自由度為 n - 1程式設計客棧

- 由於引入額外的引數(自由度df),t分布比標準正態分佈的方差更大(置信區間更寬)

- 與標準正態分佈曲線相比,自由度df越小,t分布曲線愈平坦,曲線中間愈低,曲線雙側尾部翹得愈高

- 自由度df愈大,t分布曲線愈接近正態分佈曲線,當自由度df= ∞ 時,t分布曲線為標準正態分佈曲線

**:# 不同自由度的學生t分布與標準正態分佈

import numpy as np

from scipy.stats import norm

from s import t

import matplotlib.pyplot as plt

print('比較t-www.cppcns.com分布與標準正態分佈')

x = np.linspace( -3, 3, 100)

plt.plot(x, t.pdf(x,1), label='df=1')

plt.plot(x, t.pdf(x,2), label='df=20')

plt.plot(x, t.pdf(x,100), label = 'df=100')

plt.plot( x[::5], norm.pdf(x[::5]),'kx', label='normal')

plt.legend()

plt.show()

執行結果:

本文標題: python 計算t分布的雙側置信區間

本文位址:

R與t分布(3) 分布的檢驗

我們依然用kolmogorov smirnov連續分布檢驗法來檢驗乙個連續分布是否是服從t分布。原假設為h0 資料集符合t分布 研究假設h1 樣本所來自的總體分布不符合t分布。令f0 x 表示預先假設的理論分布,fn x 表示隨機樣本的累計概率 頻率 函式.統計量d為 d max f0 x fn x...

Python的雙下劃方法

算數運算子 一元運算子 neg pos abs abs 眾多比較運算子 lt le eq ne gt ge 算術運算子 add sub mul truediv floordiv mod divmod divmod pow 或 pow round round 反向算術運算子 radd rsub rmu...

Python學習筆記一 Python中的time

返回時間戳,即 從1970年1月1日午夜 曆元 到今日經過了的秒數。import time 引入time模組 ticks time.time time 函式用來返回時間戳 print 當前時間戳為 ticks執行結果 當前時間戳為 1459994552.51 python用乙個含有九個數字的元組來表...