# 技術場景:在總體的標準差已知的情況下,使用邊際誤差與區間估計,**總體的引數
# 應用場景:現有過去1 ~ 12月的銷售資料,並且每個月的銷售資料的變動幅值不太大,現在有了100條當月銷售資料,求取當月可能的銷售額度
# 使用這些值,去做一次統計推斷,推斷當月銷售額度可能的數值區間
import numpy as np
import copy
global sales_used
global sales_current
sales_used = list()
sales_current = list()
def databox():
n = 12
root_means = np.random.randint(low=240, high=270, size=13)
# 生成過去12個月的銷量,服從正態分佈,且均值在 240 ~ 270 之間的數值
for i in range(n):
sale_month = np.random.normal(root_means[i], 4, 500)
sale_month = sale_month.tolist()
i = i + 1
print('過去12個月的銷量:', sales_used)
# 生成當月的銷售資料,服從正態分佈,且均值在 240 ~ 270 之間的數值
data_current = np.random.normal(root_means[12], 4, 100)
print('當月目前的銷售額度:', sales_current)
return
def samplingwork():
# 當月的銷售資料為100條,我們以50個為一組樣本,進行抽樣,抽樣操作為50次,求取每次的抽樣後的均值,50個均值服從正態分佈
mean_list = list()
for i in range(50):
data = np.random.choice(sales_current[0], size=50)
mean_one = np.mean(data)
i = i + 1
mean_current = np.mean(mean_list)
print('當月銷售額度的抽樣分布資料:', mean_list)
return mean_current
def recomment():
means_used = np.mean(sales_used, axis=1) # 過去12個月銷售額度的均值
print('過去12個月,每個月的銷售額度的均值:means_used=', means_used)
std_used = np.std(sales_used, axis=1) # 過去12個月銷售額度的標準差,過去的銷售資料為標準差為std_used的正態分佈
print('過去12個月,每個月的銷售標準差:', std_used)
std_used = np.mean(std_used)
print('std_used=', std_used)
print('sales_current=', sales_current)
mean_current = samplingwork() # 當月的銷售額度的均值
print('mean_current=', mean_current)
std_current = std_used / np.sqrt(100) # 因為當月的銷售資料為100條,因此這裡是100,當前的銷售資料為標準差為std_current的正態分佈
print('std_current=', std_current)
# 任何正態分佈隨機變數都有95%的值在均值附近[-1.96, +1.96]個標準差以內,因此當sales_current的抽樣分布是正態分佈時,則一定有95%的值
# 在均值[u + 1.96*標準差, u - 1.96*標準差]的範圍內
# 因此這裡的置信水平為0.95
b_current = 1.96 * std_current
left_location = mean_current - b_current
right_location = mean_current + b_current
print('left_location=', left_location)
print('right_location=', right_location)
# 通過計算,總體的均值,在置信水平為0.95的水平下,會在區間[left_location, right_location]範圍內
return
def workspace():
databox()
recomment()
return
workspace()
置信區間與置信度
本文簡要介紹了置信區間這一核心概念,它有助於我們從直觀上理解評價估計優劣的度量方法。假設你想知道美國有多少人熱愛足球。為了得到 100 正確的答案,你可以做的唯一一件事是向美國的每一位公民詢問他們是否熱愛足球。根據維基百科,美國有超過 3.25 億的人口。與 3.25 億人談話並不現實,因此我們必須...
置信區間 confidence interval
置信區間 find an interval such that reasonbly confident that were is a 95 chance that the true p x sampling distribution of the sample mean mean of the sa...
95 置信區間
置信區間在spss裡可以通過描述 探索獲得 1.樣本容量大於30 根據中心極限定律以及正態分佈 z table 95 置信區間的範圍基本等於 sample mean 2 樣本均值的抽樣分布的標準差 這裡,sample mean是觀測到的,2 是查正態分佈z table表得出,而樣本均值的抽樣分布的標...