r語言 面板資料回歸 R語言高階之廣義線性回歸

2021-10-14 06:26:06 字數 2362 閱讀 8146

廣義線性回歸是一類常用的統計模型,在各個領域都有著廣泛的應用。今天我會以邏輯回歸和泊松回歸為例,講解如何在r語言中建立廣義線性模型。

在r語言中我們通常使用glm()函式來構建廣義線性模型,glm實際上是generalized linear model(廣義線性模型)的首字母縮寫,它的具體形式如下所示:

glm(formula, family=familytype(link=linkfunction), data=)

# formula就是我們的模型形式,family是我們指定的具體回歸型別(見下表)

你可以通過help(glm)來檢視其它的模型選項, 使用help(family)來檢視每一族的連線函式。在這裡我主要和大家講解一下邏輯(logistic)回歸和泊松(poisson)回歸這兩個模型。

第一部分 邏輯回歸

邏輯回歸主要應用於因變數(y)是二分類變數而自變數(x)是連續型變數的情形,當然這裡的自變數和因變數也可以都是分類變數。由於邏輯回歸本身的假設條件並沒有那麼嚴格,因此它的應用範圍比判別分析要更廣。關於判別分析的知識,我會在後續內容中和大家詳細介紹。

這裡我們使用鳶尾花(iris)資料集,將setosa這一類去掉後鳶尾花的種類(species)就是乙個二分類變數,將virginica設定為0,versicolor設定為1,使用花瓣和花萼資料來**鳶尾花的種類。

# 邏輯回歸

mydata

mydata$type[which(mydata$species== "virginica")]

mydata$type[which(mydata$species== "versicolor")]

attach(mydata) # 固定資料集

fit

summary(fit) # 輸出擬合結果

confint(fit) # 輸出95%置信區間

exp(coef(fit)) # 取擬合係數的自然指數

exp(confint(fit)) # 取95%置信區間的自然指數

predict(fit, type="response") # 輸出擬合值

residuals(fit, type="deviance") # 輸出殘差

從輸出結果來看,花瓣長度是可以較好區分這兩類鳶尾花的,但是這個模型是原始和粗糙的,我們應該通過回歸診斷的方式來修正此模型,使之更加精確,關於回歸診斷請參見r語言入門之線性回歸,這裡就不贅述。

當然我們也可以用anova(fit1,fit2,test="chisq")來比較模型的優劣,這個在入門階段也已經介紹過了,不明白的可以參考往期內容方差分析(anova)。

第二部分 泊松回歸

泊松回歸主要用於因變數(y)是計數資料而自變數(x)是連續型變數的時候,當然自變數(x)也可以是分類變數。

這裡我先和大家介紹一下資料的資訊,這個資料主要包括三部分資訊:treatment代表對患者採取的**措施,分成1、2、3三類,1代表被認可的有效藥,2代表新藥a,3是指新藥b;outcome是指患者**之後的結局,同樣可分成1、2、3三類,1代表病情好轉,2代表病情遷延不癒(沒惡化),3代表病情惡化;counts是指採取不同**措施的不同結局的患者個數,是乙個計數資料。注意這裡不使用安慰劑作為空白對照的原因主要是考慮到倫理學問題,原則上要使患者利益最大化。

# 泊松回歸

# counts是計數值

# outcome是指患者**後可能的結局

# treatment是指對患者採取的**措施

counts

outcome

treatment

print(d.ad

glm.d93

summary(glm.d93) # 輸出回歸結果

這裡我們主要看一下相關係數(coefficients),只有outcome2的p值顯著並且其效應量值(estimate)是負值,由此可見這三種藥之間的效果可能差異不大,並且都能使患者受益。那麼只能說這兩個新藥和現行藥的療效差不多,並不是新藥的效果更好。

當然,如果擬合模型的殘差比自由度大很多,這個時候最好使用quasipossion()。

r語言 面板資料回歸 R語言分析面板資料 簡單案例

r語言分析面板資料 簡單案例 標籤 r語言 面板資料 1.面板資料定義 2.r語言中進行面板資料分析的包 plm 3.乙個關於工資水平的案例 資料一覽 code r install.packages plm library plm data wages package plm rd plm lwag...

r語言 面板資料回歸 R語言 地理加權回歸分析

理論知識 地理加權回歸 geographically weighted regression,gwr 是一種空間分析技術,廣泛應用於地理學及涉及空間模式分析的相關學科。gwr通過建立空間範圍內每個點處的區域性回歸方程,來探索研究物件在某一尺度下的空間變化及相關驅動因素,並可用於對未來結果的 由於它考...

R語言線性回歸

線性回歸模型 線性回歸模型的計算 lm 可以完成多元線性回歸函式的估計,回歸系統與回歸方程的檢驗的工作 summary 函式,返回列表內容 x1表示體重,x2表示年齡,y表示對應體重與年齡下的血壓 blood data frame x1 c 76.0,91.5,85.5,82.5,79.0,80.5...