glm的poisson回歸中offset的含義

2021-10-06 07:35:55 字數 500 閱讀 7407

poisson回歸中的offset項是為了更方便的研究「率」。

某乙個變數雖然服從poisson分布,但他的發生受暴露的影響,比如腫瘤的發生數受觀察人年數的影響。

可能你想研究的是腫瘤發生率與各因素的關係,但是由於是發生數case服從poisson分布,而不是率服從poisson分布,所以最後只能寫成下式:

反映在r**中即為:

glm(y ~ offset(log(exposure)

)+ x, family=poisson(link=log)

)

證明:log(rate)=θ『x 等價於 log(case) = log(exposure) + θ『x

如果寫成

glm(i(y/exposure)

~ x, family=poisson(link=log)

)

是不對的,也會使結果失去意義

參考2

線性回歸中的數學原理

優點 結果易於理解,計算上不複雜 缺點 對非線性的資料擬合不好 適用資料型別 數值型和標稱型 基本步驟 收集資料 準備資料 分析資料 訓練演算法 測試演算法 使用演算法 平方誤差的計算公式 su m 1,m yi x it w 2 t在這裡代表矩陣的轉置,是python中常用的語法 w最優解公式 w...

線性回歸中的對於「線性」的理解

所謂 線性 回歸,那當然一定是 線性 才能用的回歸。如果你的自變數和因變數之間的關係都不是 線性 關係,那還叫什麼 線性 回歸?假設x是自變數,y是因變數,且滿足如下線性關係 y i beta 0 beta 1xi nu i 其實線性假定並不要求初始模型都呈上述的嚴格線性關係,可以通過對自變數和因變...

線性回歸中的誤差及解決措施

來自方差variance的誤差 來自偏置bias的誤差 下面這張圖直觀表示了方差和偏置水平的關係。可以將真實值作為靶心,將帶入擬合的曲線得到的輸出值作為投擲的點,那麼會遇到如下四種 2 2 2 times 2 2 2 情況,分別是 高方差高偏置,高方差低偏置,低方差高偏置,低方差低偏置。最理想的情況...