回歸分析(regression analysis)是確定兩種或兩種以上變數間相互依賴的定量關係的一種統計分析方法。
在回歸分析中,如果有兩個或兩個以上的自變數,就稱為多元回歸。
windsor房價資料集,其中包含有關安大略省溫莎市區房屋銷售的資訊。
讀取資料,將資料區分為自變數與結果變數
def readdata():
x =
y =
with open('housing.csv') as f:
rdr = csv.reader(f)
# skip the header row
next(rdr)
# read x and y
for line in rdr:
xline = [1.0]
for s in line[:-1]:
return (x,y)
將資料再細分為訓練資料與測試資料測試資料是必需的,它用來衡量模型的準確程度
x=np.array(x0[:-10])
y=np.array(y0[:-10])
計算回歸係數採用公式β= (x
tx)-1 x
ty
xtx=np.dot(x.t,x)
xty=np.dot(x.t,y)
beta=np.linalg.solve(xtx,xty)
計算**資料並於真實資料比較,評價**精度
for data,actual in zip(x0[-10:],y0[-10:]): #打個包,一起來遍歷
x=np.array(data)
prediction=np.dot(x,beta)
print(prediction)
rang=np.arange(0,10)
plt.plot(rang,pre,label='pre')
plt.plot(rang,act,label='act')
plt.legend()
plt.show()
**結果(pre)與真實結果 (act)比較:
由影象可見,**精確度有待提高。
多元線性回歸
多元線性回歸的基本原理和基本計算過程與一元線性回歸相同,但由於自變數個數多,計算相當麻煩,一般在實際中應用時都要借助統計軟體。介紹多元線性回歸的一些基本問題。但由於各個自變數的單位可能不一樣,比如說乙個消費水平的關係式中,工資水平 受教育程度 職業 地區 家庭負擔等等因素都會影響到消費水平,而這些影...
多元線性回歸
from numpy import genfromtxt 用來讀取資料轉化為矩陣 from sklearn import linear model 含有回歸的模型 datapath r c users qaq desktop delivery dummy.csv 路徑 deliverydata ge...
多元線性回歸
比如有乙個住房 的資料集,可能會有多個不同的模型用於擬合,選擇之一像是這種二次模型 0 1x 2x2,因為直線並不能很好的擬合這些資料。但是現在如果用二次函式去考慮,可能會想到二次函式在最高點之後會下降,但是 並不會下降,並不合理,那我們可以用 0 1x 2x2 3x3這樣的三次模型。如果像這樣選擇...