SPSS多元線性回歸輸出結果的詳細解釋

2021-12-30 04:14:50 字數 1548 閱讀 5747

spss多元線性回歸輸出結果的詳細解釋,先說一句題外話,如果當年在大學裡數理統計等課程結合spss,sas,r等軟體來講,應該效果會好很多。

最近做了一些用spss進行線性回歸的實驗,還是感覺很多細節把握不好,這裡結合我的實驗結果,以及網上別人的介紹總結一下,先貼幾張spss的輸出:

下面簡單解釋一下這三張圖中的結果:

第乙個表模型彙總表中,r表示擬合優度(goodness of fit),它是用來衡量估計的模型對觀測值的擬合程度。它的值越接近1說明模型越好。調整的r平方比調整前r平方更準確一些,圖中的最終調整r方為0.550,表示自變數一共可以解釋因變數55%的變化(variance),另外,由於使用的是stepwise linear regression (swlr),分析——回歸——線性——「方法」選擇「逐步」,所以模型1、2、3的r方逐漸增大,標準誤差逐漸減小。

(據網友的介紹:一般認為,擬合優度達到0.1為小效應(r方0.01),0.3為中等r方0.09),0.5為大(r方0.25),這是針對自然科學的一般界限。)

第二個表anova表示方差分析結果,主要看f和sig值兩個,f值為方差分析的結果,是乙個對整個回歸方程的總體檢驗,指的是整個回歸方程有沒有使用價值(與隨機瞎猜相比),其f值對應的sig值小於0.05就可以認為回歸方程是有用的。另外,從f值的角度來講:f的值是回歸方程的顯著性檢驗,表示的是模型中被解釋變數與所有解釋變數之間的線性關係在總體上是否顯著做出推斷。若f>fa(k,n-k-1),則拒絕原假設,即認為列入模型的各個解釋變數聯合起來對被解釋變數有顯著影響,反之,則無顯著影響。

這裡簡單對fa(k,n-k-1)進行一下解釋,k為自變數個數,n為樣本容量,n-k-1為自由度。對於我的實驗中的情況來講,k=3,樣本容量為146,所以查表的時候應該差fa(3,142),一般數理統計課本中都有f分布表,a表示的顯著性水平(一般取0.05),但我們手頭不一定會有課本,就需要借助於excel來查f表,開啟excel,在公式區輸入:=finv(0.05,3,142),在單元格中即出現2.668336761,表中的f值顯著大於這個值,則認為各個解釋變數對因變數有顯著影響。

需要注意的是,方差分析是對多個自變數的總體檢驗,而不是單個自變數(單個自變數在係數表中,為單樣本t檢驗),這就是第三個表回歸係數表中的內容。

係數**列出了自變數的顯著性檢驗結果(使用單樣本t檢驗),最後一列為t檢驗的sig,表中均小於0.05,說明自變數對因變數具有顯著影響,b表示各個自變數在回歸方程中的係數,負值表示ipgf這個自變數對因變數有顯著的負向影響,但是由於每個自變數的量綱和取值範圍不同,基於b並不能反映各個自變數對因變數影響程度的大小,這時候我們就要借助標準係數。目前**中的「試用版」實際上是beta的意思,此時數值越大表示對自變數的影響更大。

從這個分析過程來看,這個實驗結果還挺理想的。

spss多元線性回歸 多元線性回歸 如何設定啞變數

一.logistic 回歸於線性回歸的不同 logistic 回歸,因變數是分類變數 線性回歸,因變數是連續變數 二.多元線性回歸 如何設定啞變數 一 當單個自變數是分類變數,水平等於2時,不需要設定啞變數 二 當單個自變數是分類變數,水平大於2時,要設定啞變數 下面講一下如何設定啞變數 1.自變數...

多元線性回歸

多元線性回歸的基本原理和基本計算過程與一元線性回歸相同,但由於自變數個數多,計算相當麻煩,一般在實際中應用時都要借助統計軟體。介紹多元線性回歸的一些基本問題。但由於各個自變數的單位可能不一樣,比如說乙個消費水平的關係式中,工資水平 受教育程度 職業 地區 家庭負擔等等因素都會影響到消費水平,而這些影...

多元線性回歸

from numpy import genfromtxt 用來讀取資料轉化為矩陣 from sklearn import linear model 含有回歸的模型 datapath r c users qaq desktop delivery dummy.csv 路徑 deliverydata ge...