R語言 邏輯回歸各統計量解讀

2021-10-04 23:53:50 字數 2920 閱讀 4464

邏輯回歸是回歸模型,其中響應變數(因變數y)具有諸如true / false或0/1的分類值。 它實際上基於將其與**變數(自變數x)相關的數學方程測量二元響應的概率,作為響應變數的值。

邏輯回歸的一般數學方程為 :

y = 1/(1+e^-(a+b1x1+b2x2+b3x3+…))

以下是所使用的引數的描述 :

邏輯回歸中glm()函式的基本語法是:

glm(formula,data,family)

以下是所使用的引數的描述:

舉個栗子:

內建資料集「mtcars」描述具有各種發動機規格的汽車的不同型號。

在「mtcars」資料集中,傳輸模式(自動或手動)由am列描述,它是乙個二進位制值(0或1)。 我們可以在列「am」和其他3列(hp,wt和cyl)之間建立邏輯回歸模型。

輸入:

# select some columns form mtcars.

input

<

- mtcars[

,c("am"

,"cyl"

,"hp"

,"wt")]

print

(head(

input

))

輸出:

am cyl  hp    wt

mazda rx4 1

6110

2.620

mazda rx4 wag 1

6110

2.875

datsun 71014

932.320

hornet 4 drive 0

6110

3.215

hornet sportabout 0

8175

3.440

valiant 0

6105

3.460

……… …………… ………… …………

建立回歸模型:

我們使用glm()函式建立回歸模型,並得到其摘要進行分析。

輸入:

input

<

- mtcars[

,c("am"

,"cyl"

,"hp"

,"wt")]

am.data = glm(formula = am ~ cyl + hp + wt, data =

input

, family = binomial)

print

(summary(am.data)

)

輸出:

call:

glm(formula = am ~ cyl + hp + wt, family = binomial, data =

input

)deviance residuals:

min 1q median 3q max

-2.17272

-0.14907

-0.01464

0.14116

1.27641

coefficients:

estimate std. error z value pr(

>

|z|)

(intercept)

19.70288

8.11637

2.428

0.0152

*cyl 0.48760

1.07162

0.455

0.6491

hp 0.03259

0.01886

1.728

0.0840

.wt -

9.14947

4.15332

-2.203

0.0276*-

--signif. codes:

0 『**

*』 0.001 『**』 0.01 『*』 0.05 『.』 0.1 『 』 1

(dispersion parameter for binomial family taken to be 1

) null deviance:

43.2297 on 31 degrees of freedom

residual deviance:

9.8415 on 28 degrees of freedom

aic:

17.841

number of fisher scoring iterations:

8

warning messages:

上述兩個報錯點可以參照:

deviance residuals:偏差殘差統計量。

在理想情況下服從正態分佈,普通最小二乘法在數學上保證產生均值為0的殘差。

coefficients:係數。

如果乙個變數的係數為0,那麼這個變數是沒有意義的,它對模型毫無貢獻。

這裡的係數只是估計,不會真正為0,那麼從統計的角度而言,真正的係數為0的可能性是多大?這就依賴於z統計量(z value)和p值(pr(>|t|))。

結論:

在總結中,對於變數「cyl」和「hp」,最後一列中的p值(pr(>|z|))大於0.05,我們認為它們對變數「am」的值有貢獻是無關緊要的。 只有重量(wt)影響該回歸模型中的「am」值。

R語言邏輯回歸

邏輯回歸是一種回歸模型,其響應變數 因變數 具有分類值,如true false或0 1。它實際上是根據與 變數相關的數學方程,來衡量二進位制響應的概率作為響應變數的值。邏輯回歸的一般數學方程為 y 1 1 e a b1x1 b2x2 b3x3 以下是使用的引數的描述 用於建立回歸模型的函式是glm ...

R語言線性回歸

線性回歸模型 線性回歸模型的計算 lm 可以完成多元線性回歸函式的估計,回歸系統與回歸方程的檢驗的工作 summary 函式,返回列表內容 x1表示體重,x2表示年齡,y表示對應體重與年齡下的血壓 blood data frame x1 c 76.0,91.5,85.5,82.5,79.0,80.5...

r語言 面板資料回歸 R語言 地理加權回歸分析

理論知識 地理加權回歸 geographically weighted regression,gwr 是一種空間分析技術,廣泛應用於地理學及涉及空間模式分析的相關學科。gwr通過建立空間範圍內每個點處的區域性回歸方程,來探索研究物件在某一尺度下的空間變化及相關驅動因素,並可用於對未來結果的 由於它考...