3.1 資料準備工作
#匯入所需要的庫
import pandas as pd
import numpy as np
import math
import matplotlib.pyplot as plt
#資料的準備工作
with open("ratings.dat") as file:
data =
for line in file:
if len(line) != 0:
rating 原始資料vs 單列的評分特徵
# 計算theta值執行結果為:def caltheta(data):
sum = 0
for num in data:
sum += math.log(num,math.e)
return sum/(len(data))
# 計算sigma值
def calsigma(data,theta):
sum = 0
for num in data:
mid = math.log(num,math.e) - theta
mid *= mid
sum += mid
return math.sqrt(sum/(len(data)))
# 畫出影象
def drawp1(sigma,theta):
x = np.linspace(1,5,5000)
y = np.array([1/(sigma*i*math.sqrt(2*math.pi))*math.exp(-math.pow(math.log(i,math.e)-theta,2)/(2*sigma*sigma)) for i in x])
maxnum = y.max()*1.2
minnum = 0
plt.plot(x,y)
plt.ylim(minnum,maxnum)
plt.show()
print("sigma is {} theta is {}".format(sigma,theta))
# 主函式
if __name__ == '__main__':
npdata = np.array(data)
theta = caltheta(data)
sigma = calsigma(data,theta)
drawp1(sigma,theta)
# 計算theta值
def caltheta(data):
sum = 0
for num in data:
sum += num
return sum/(len(data))
# 計算sigma值
def calsigma(data,theta):
sum = 0
for num in data:
mid = num - theta
mid *= mid
sum += mid
return math.sqrt(sum/(len(data)))
# 畫出影象
def drawp1(sigma,theta):
x = np.linspace(-10,10,5000)
y = np.array([1/(sigma*math.sqrt(2*math.pi))*math.exp(-math.pow(i-theta,2)/(2*sigma*sigma)) for i in x])
maxnum = y.max()*1.2
minnum = 0
plt.plot(x,y)
plt.ylim(minnum,maxnum)
plt.show()
# 主函式
if __name__ == '__main__':
# data = readfile(path)
npdata = np.array(data)
theta = caltheta(data)
sigma = calsigma(data,theta)
drawp1(sigma,theta)
執行結果:
可以看出,由於最開始假設的概率密度函式的不同,即使使用同乙份資料訓練,也會得到完全不同的結果,也就是說,該實驗結果可以表明,引數估計的方法的結果準確性極大地依賴於假設的概率密度分布是否正確。
動手實踐引數估計
引數估計 引數估計
1 引數估計 用樣本統計量去估計總體的引數。2 估計量 用於估計總體引數的統計量的名稱 如樣本均值,樣本比例,樣本方差等 例如 樣本均值就是總體均值 3 引數用 4 估計值 估計引數時計算出來的統計量的具體值 如果樣本均值 5 點估計 例如 用樣本均值直接作為總體均值的估計乙個點估計量的可靠性是由它...
python 引數 Python引數估計
引數估計,是統計推斷的一種。根據從總體中抽取的隨機樣本來估計總體分布中未知引數的過程。從估計形式看,區分為點估計和區間估計 從構造估計量的方法講,有矩法估計 最小二乘估計 似然估計 貝葉斯估計等。要處理兩個問題 求出未知引數的估計量 在一定信度 可靠程度 下指出所求的估計量的精度。信度一般用概率表示...
引數估計與非引數估計
引數估計 parameter estimation 根據從 總體中抽取的 樣本估計總體分布中包含的未知引數的方法。人們常常需要根據手中的資料,分析或推斷資料反映的本質規律。即根據樣本資料如何選擇統計量去推斷總體的分布或數字特徵等。統計推斷是數理統計研究的核心問題。所謂統計推斷是指根據樣本對總體分布或...