from numpy import genfromtxt#用來讀取資料轉化為矩陣
from sklearn import linear_model#含有回歸的模型
datapath = r"c:\users\qaq\desktop\delivery_dummy.csv"#路徑
deliverydata = genfromtxt(datapath, delimiter = ',')#講csv檔案轉化為矩陣到deliverydata,分隔符為逗號
print "data"
print deliverydata
x = deliverydata[:,:-1]#講所有行和至倒數第二列存在x裡面, 其實就是將除了最後一列都存在x(特徵值)
y = deliverydata[:, -1]#將最後一列存在y
print 'x'
print x
print "y"
print y
regr = linear_model.linearregression()#建立模型
regr.fit(x, y)
print "coefficents"
print regr.coef_#列印引數
print "intercept"
print regr.intercept_#列印截面
xpred=[102, 6]
ypred=regr.predict(xpred)#進行**
print ypred
多元線性回歸
多元線性回歸的基本原理和基本計算過程與一元線性回歸相同,但由於自變數個數多,計算相當麻煩,一般在實際中應用時都要借助統計軟體。介紹多元線性回歸的一些基本問題。但由於各個自變數的單位可能不一樣,比如說乙個消費水平的關係式中,工資水平 受教育程度 職業 地區 家庭負擔等等因素都會影響到消費水平,而這些影...
多元線性回歸
比如有乙個住房 的資料集,可能會有多個不同的模型用於擬合,選擇之一像是這種二次模型 0 1x 2x2,因為直線並不能很好的擬合這些資料。但是現在如果用二次函式去考慮,可能會想到二次函式在最高點之後會下降,但是 並不會下降,並不合理,那我們可以用 0 1x 2x2 3x3這樣的三次模型。如果像這樣選擇...
多元線性回歸
設 n為特徵數量,m為樣本數量,x i 為向量,就是乙個樣本的所有特徵 現在我們的特徵數量變多了,式自然也改變了 變為 則 唯度都為n 1 那麼 公式就為 代價函式為 我們約定x 0 1,那麼當特徵數量 n 1 時,我們進行下面這個公式進行梯度下降,直到收斂 但是這樣有的時候我們會遇到麻煩,在特徵的...