這週的學習內容是引數估計實踐,主要是使用python對我們上週學習的理論知識進行實踐。
正態分佈下的置信區間
def
norm_conf
(data,confidence=
0.95):
# sample_mean = np.mean(data)
sample_std = np.std(data,ddof=1)
sample_size =
len(data)
conf_intveral = scipy.stats.norm.interval(confidence, loc=sample_mean, scale=sample_std)
print
(conf_intveral)
t分布下的置信區間
```python
defttest_conf
(data,confidence=
0.95):
sample_mean = np.mean(data)
sample_std = np.std(data,ddof=1)
sample_size =
len(data)
conf_intveral = scipy.stats.t.interval(confidence,df =
(sample_size-1)
, loc=sample_mean, scale=sample_std)
print
(conf_intveral)
ttest_conf(scale_means)
重複抽取資料
scale_means =
for _ in
range
(1000):
scale_sample = age.sample(
100, replace=
true
) mean = scale_sample.mean(
)norm_conf(scale_means)
繪製資料
import seaborn as sns
from matplotlib import pyplot as plt
sns.set_palette(
"hls"
)#設定所有圖的顏色,使用hls色彩空間
sns.distplot(scale_means,color=
"r",bins=
10,kde=
true
)plt.title(
'age'
)plt.xlim(25,
35)plt.grid(
true
)plt.show(
)
統計學第九周 引數估計python實現
統計學第九周 引數估計複習 引數估計,根據從總體中隨機取樣獲得樣本,根據取樣樣本來估計總體分布中引數的過程。方法 估計形式上分 點估計與區間估計 估計的方法有矩法估計,最小二乘法估計,似然估計,貝葉斯估計等等 問題一般有 未知引數的估計量 在一定置信度下求解估計量的精度 實戰2.1 coding u...
統計學 回歸分析 第九周
最小二乘法 擬合優度檢驗 顯著性檢驗 回歸 殘差分析 多元線性回歸 參考總結 相關關係是值變數的數值之間存在這依存關係,即乙個變數的數值會隨著另乙個變數或幾個變數的數值變化而呈現出一定的變化規律。例如 人的身高和體重的關係,居民收入增長率與物價指數的關係等等 相關關係的分類 也可根據相關關係的變數個...
統計學 統計學基礎
五種抽樣方法 1 簡單隨機 選取熱量相同且每個樣本有同等概率被選擇的樣本 2 系統 簡單的系統抽取樣本 3 任意 使用乙個碰巧很容易被選擇的樣本 4 整群 先將總體分為不同組群,從中隨機挑選幾個組群作為樣本 5 分層 定義層級,在每個層級隨機抽取樣本。抽樣方法的選擇一定要符合 1 只有樣本對總體具有...