多元回歸分析的心得(筆記)
通過一篇部落格內的文章
對我最近幫老師做多元回歸分析求解相關係數有很大幫助(從零開始涉獵)
在網上查詢的很多有關求解多元回歸分析相關係數的文章,但大部分都是通過sklearn來進行回歸分析的研究,將資料拆分成訓練資料以及測試資料,機器通過訓練資料獲得乙個模型,再通過測試資料對模型做到檢測從而得到相關的一些資料(通過幾天的摸索得出的模糊結論)
我通過sklearn中的model.score方法的到決定係數r^ 2,再通過對r ^2進行開根號得到相關係數,但得出結果和通過excel直接得出相關係數結果偏差過大。
最終找到了開頭說的文章
公式原理並不太清楚,只是經典的套娃,通過文章內容自己推導了一下(部落格文章內容是1個因變數,2個自變數,但我還需要1個因變數,3個自變數的做法)
總結一下心得:
下邊是原始資料(第一列pi+1為因變數,後頭pi,pw為自變數):
以下**與上邊部落格文章中的**基本一致,僅通過自己推理做出了一些改變
x1=gongshi1[
"pi上旬平均含水量"
].values
x11=np.array(
[x1]).t
x2=gongshi1[
"pw本旬降雨量"
].values
x22=np.array(
[x2]).t
#若需要3列自變數的作法如下
#x3=gongshi[new_column_name].values
#x33=np.array([x3]).t
y=gongshi1[
"pi+1本旬平均含水量"
].values
y1=np.array(
[y])
.t #上邊是將三列轉化為陣列並獲得其轉置
a =for i in
range
(len
(y)):[
1])#創造與資料長度一致的係數矩陣
b=np.hstack(
(a,x11)
) x=np.hstack(
(b,x22)
)#3列自變數的做法:x=np.hstack((b,x22,x33))
x_=x.t
x_x=np.dot(x_,x)
x_x_=np.linalg.inv(x_x)
w=np.dot(np.dot(
(x_x_)
,(x_)
),y1)
b=w[0]
[0] a1=w[1]
[0] a2=w[2]
[0]#3列子自變數做法:
#a3=w[3][0]
sumy=
0 y1=
0for i in
range(0
,len
(y))
: sumy=sumy+y[i]
y1=sumy/
len(y)
y_y1=
0for i in
range(0
,len
(y))
: y_y1=y_y1+
(y[i]
-y1)
sales1=
for i in
range(0
,len
(y))
:+a2*x2[i]
+b) y2=
0 sumy2=
0for i in
range
(len
(sales1)):
sumy2=sumy2+sales1[i]
y2=sumy2/
len(sales1)
y11_y2=
0for i in
range(0
,len
(sales1)):
y11_y2=y11_y2+
(sales1[i]
-y2)
syy=
0for i in
range(0
,len
(y))
: syy=syy+
((y[i]
-y1)
*(y[i]
-y1)
)
sy1y1=
0for i in
range(0
,len
(sales1)):
sy1y1=sy1y1+
((sales1[i]
-y2)
*(sales1[i]
-y2)
) syy1=
0for i in
range(0
,len
(sales1)):
syy1=syy1+
((y[i]
-y1)
*(sales1[i]
-y2)
) r1=syy1/
((syy*sy1y1)
**0.5
)#此結果即為相關係數
scikit learn 回歸分析 多元回歸
般線性回歸中,使用的假設函式是一元一次方程,也就是二維平面上的一條直線。但是很多時候可能會遇到直線方程無法很好的擬合資料的情況,這個時候可以嘗試使用多項式回歸。多項式回歸中,加入了特徵的更高次方 例如平方項或立方項 也相當於增加了模型的自由度,用來捕獲資料中非線性的變化。新增高階項的時候,也增加了模...
EXCEL多元回歸分析
一 多元回歸分析定義 多元回歸分析 multiple regression analysis 是指在相關變數中將乙個變數視為因變數,其他乙個或多個變數視為自變數,建立多個變數之間線性或非線性數學模型數量關係式並利用樣本資料進行分析的統計分析方法。二 不多說,上例項分析過程 1 資料整理 2 資料建模...
多元回歸分析中的分類變數(筆記)
兩個水平 如果分類變數只有兩個水平 例如性別,男和女 我們只需要定義乙個虛擬變數就可以了,用0表示男,用1表示女。超過兩個水平 當乙個分類變數超過兩個水平時,我們必須在定義虛擬變數和解釋虛擬變數兩方面謹慎從事。重點是要牢記 在多元回歸分析中,如果乙個分類變數有k個水平,那麼需要在多元回歸分析中定義k...