邏輯回歸是回歸模型,其中響應變數(因變數y)具有諸如true / false或0/1的分類值。 它實際上基於將其與**變數(自變數x)相關的數學方程測量二元響應的概率,作為響應變數的值。
邏輯回歸的一般數學方程為 :
y = 1/(1+e^-(a+b1x1+b2x2+b3x3+…))以下是所使用的引數的描述 :
邏輯回歸中glm()函式的基本語法是:
glm(formula,data,family)以下是所使用的引數的描述:
舉個栗子:
內建資料集「mtcars」描述具有各種發動機規格的汽車的不同型號。
在「mtcars」資料集中,傳輸模式(自動或手動)由am列描述,它是乙個二進位制值(0或1)。 我們可以在列「am」和其他3列(hp,wt和cyl)之間建立邏輯回歸模型。
輸入:
# select some columns form mtcars.
input
<
- mtcars[
,c("am"
,"cyl"
,"hp"
,"wt")]
print
(head(
input
))
輸出:
am cyl hp wt
mazda rx4 1
6110
2.620
mazda rx4 wag 1
6110
2.875
datsun 71014
932.320
hornet 4 drive 0
6110
3.215
hornet sportabout 0
8175
3.440
valiant 0
6105
3.460
……… …………… ………… …………
建立回歸模型:
我們使用glm()函式建立回歸模型,並得到其摘要進行分析。
輸入:
input
<
- mtcars[
,c("am"
,"cyl"
,"hp"
,"wt")]
am.data = glm(formula = am ~ cyl + hp + wt, data =
input
, family = binomial)
print
(summary(am.data)
)
輸出:
call:
glm(formula = am ~ cyl + hp + wt, family = binomial, data =
input
)deviance residuals:
min 1q median 3q max
-2.17272
-0.14907
-0.01464
0.14116
1.27641
coefficients:
estimate std. error z value pr(
>
|z|)
(intercept)
19.70288
8.11637
2.428
0.0152
*cyl 0.48760
1.07162
0.455
0.6491
hp 0.03259
0.01886
1.728
0.0840
.wt -
9.14947
4.15332
-2.203
0.0276*-
--signif. codes:
0 『**
*』 0.001 『**』 0.01 『*』 0.05 『.』 0.1 『 』 1
(dispersion parameter for binomial family taken to be 1
) null deviance:
43.2297 on 31 degrees of freedom
residual deviance:
9.8415 on 28 degrees of freedom
aic:
17.841
number of fisher scoring iterations:
8
warning messages:
上述兩個報錯點可以參照:
deviance residuals:偏差殘差統計量。
在理想情況下服從正態分佈,普通最小二乘法在數學上保證產生均值為0的殘差。
coefficients:係數。
如果乙個變數的係數為0,那麼這個變數是沒有意義的,它對模型毫無貢獻。
這裡的係數只是估計,不會真正為0,那麼從統計的角度而言,真正的係數為0的可能性是多大?這就依賴於z統計量(z value)和p值(pr(>|t|))。
結論:
在總結中,對於變數「cyl」和「hp」,最後一列中的p值(pr(>|z|))大於0.05,我們認為它們對變數「am」的值有貢獻是無關緊要的。 只有重量(wt)影響該回歸模型中的「am」值。
R語言邏輯回歸
邏輯回歸是一種回歸模型,其響應變數 因變數 具有分類值,如true false或0 1。它實際上是根據與 變數相關的數學方程,來衡量二進位制響應的概率作為響應變數的值。邏輯回歸的一般數學方程為 y 1 1 e a b1x1 b2x2 b3x3 以下是使用的引數的描述 用於建立回歸模型的函式是glm ...
R語言線性回歸
線性回歸模型 線性回歸模型的計算 lm 可以完成多元線性回歸函式的估計,回歸系統與回歸方程的檢驗的工作 summary 函式,返回列表內容 x1表示體重,x2表示年齡,y表示對應體重與年齡下的血壓 blood data frame x1 c 76.0,91.5,85.5,82.5,79.0,80.5...
r語言 面板資料回歸 R語言 地理加權回歸分析
理論知識 地理加權回歸 geographically weighted regression,gwr 是一種空間分析技術,廣泛應用於地理學及涉及空間模式分析的相關學科。gwr通過建立空間範圍內每個點處的區域性回歸方程,來探索研究物件在某一尺度下的空間變化及相關驅動因素,並可用於對未來結果的 由於它考...