統計科學之多元回歸分析

2021-10-16 16:52:46 字數 1444 閱讀 1629

前面我們講了一元線性回歸,沒看過的可以先去看看:一元線性回歸分析。這一篇我們來講講多元線性回歸。一元線性回歸就是自變數只有乙個x,而多元線性回歸就是自變數中有多個x。

多元回歸的形式如下:

多元回歸方程中各個引數也是需要估計的,關於為什麼要估計,其實我們在一元線性回歸裡面也講過。與一元線性回歸不同的是,一元線性回歸擬合的是一條線,而多元回歸擬合的是乙個面。使用的方法也是最小二乘法。

在多元回歸裡面擬合程度判斷與一元回歸也類似,也主要有總平方和、回歸平方和、殘差平方和這三種。

多元回歸裡面也有r2,r2 = ssr/sst = 1 - sse/sst。因為增加自變數的會降低殘差sse,進而導致r^2增加。

為什麼加入新的變數會使sse降低呢?因為每新加入乙個新的變數,這個新的變數就會貢獻一部分平方和,而這個平方和就是從殘差裡面分離出來的。

為了避免盲目增加自變數而導致得到乙個虛高的r2,優秀的前輩們又想出了乙個新的指標,即修正後的r2。公式如下:

公式中的n為樣本量的個數,k為自變數的個數,通過n和k來調整r2,這樣就不會出現隨著自變數個數的增加而導致r2也跟著增加的情況。

我們一般用調整後的r^2來判斷多元回歸的準確性。

除了r^2以外,我們還可以使用標準誤差來衡量回歸模型的好壞。標準誤差就是均方殘差(mse)的平方根,其表示根據各自變數x來**因變數y的平均**誤差。

我們在一元線性回歸裡面做過顯著性檢驗,在多元回歸裡面也是同樣需要做顯著性判斷的。

4.1線性關係檢驗

線性關係檢驗就是檢驗y和多個x之間的關係是否顯著,是總體顯著性檢驗。

檢驗方法與一元線性回歸一致,即我們假設沒有線性關係,然後對變數進行f檢驗,具體的詳細介紹,參考一元線性回歸中講解的。

4.2回歸係數檢驗

線性關係顯著性檢驗是對多個變數的乙個顯著性判斷,也就是說只要多個x中有乙個x對y的影響是顯著的,線性關係就是顯著的。而回歸係數檢驗是用來看每乙個x對應的係數是否是顯著的。要看某個變數的係數是否顯著,假設這個變數的係數等於0,然後進行t檢驗判斷顯著性。

具體的t檢驗可以檢視假設檢驗的內容:統計學的假設檢驗。

多元回歸與一元回歸還有乙個不同點就是,多元回歸有可能會存在多重共線性。

什麼是多重共線性呢?多元回歸裡面我們希望是多個x分別對y起作用,也就是x分別與y相關。但在實際場景中,可能x1與x2之間彼此相關,我們把這種x變數之間彼此相關的情況稱為多重共線性。多重共線性可能會讓回歸得到乙個錯誤的結果。

既然多重共線性的問題很嚴重,那我們應該如何發現呢?最簡單的一種方法就是求變數之間的相關性,如果兩個變數之間高度相關,就可以認為是存在多重共線性。

對於存在多重共線性問題的變數,我們一般會把其中乙個捨棄。

scikit learn 回歸分析 多元回歸

般線性回歸中,使用的假設函式是一元一次方程,也就是二維平面上的一條直線。但是很多時候可能會遇到直線方程無法很好的擬合資料的情況,這個時候可以嘗試使用多項式回歸。多項式回歸中,加入了特徵的更高次方 例如平方項或立方項 也相當於增加了模型的自由度,用來捕獲資料中非線性的變化。新增高階項的時候,也增加了模...

EXCEL多元回歸分析

一 多元回歸分析定義 多元回歸分析 multiple regression analysis 是指在相關變數中將乙個變數視為因變數,其他乙個或多個變數視為自變數,建立多個變數之間線性或非線性數學模型數量關係式並利用樣本資料進行分析的統計分析方法。二 不多說,上例項分析過程 1 資料整理 2 資料建模...

多元回歸分析的心得 筆記

多元回歸分析的心得 筆記 通過一篇部落格內的文章 對我最近幫老師做多元回歸分析求解相關係數有很大幫助 從零開始涉獵 在網上查詢的很多有關求解多元回歸分析相關係數的文章,但大部分都是通過sklearn來進行回歸分析的研究,將資料拆分成訓練資料以及測試資料,機器通過訓練資料獲得乙個模型,再通過測試資料對...