看了
以下是廣義線性模型的內容:
1)指數家族
當固定t時,這個分布屬於指數家族中的哪種分布就由a和b兩個函式決定。
下面這種是伯努利分布,對應於邏輯回歸問題
注:從上面可知
下面這種是高斯分布,對應於經典線性回歸問題
2)glm(廣義線性模型)
指數家族的問題可以通過廣義線性模型來解決。如何構建glm呢?在給定x和引數後,y的條件概率p(y|x,θ) 需要滿足下面三個假設:
assum1) y | x; θ ∼ exponentialfamily(η).
assum2) h(x) = e[y|x]. 即給定x,目標是**t(y)的期望,通常問題中t(y)=y
assum3) η = θtx,即η和x之間是線性的
3)經典線性回歸、邏輯回歸
經典線性回歸:**值y是連續的,假設給定x和引數,y的概率分布服從高斯分布(對應構建glm的第一條假設)。由上面高斯分布和指數家族分布的對應關係可知,η=µ,根據構建glm的第2、3條假設可將model表示成:
邏輯回歸:以二分類為例,**值y是二值的,假設給定x和引數,y的概率分布服從伯努利分布(對應構建glm的第一條假設)。由上面高斯分布和指數家族分布的對應關係可知,
可以從glm這種角度理解為什麼logistic regression的公式是這個形式。
廣義線性模型
廣義線性模型是線性模型的擴充套件,主要是對非正態因變數的分析 廣義線性擬合的核心是最大似然估計,而不是最小二乘 擬合模型如下 y 0 pj 1 jx j 其中,beta是係數,mu是優勢比的對數,beta係數是對優勢比的影響。通過擬合求得的就是 我們可以通過兩個例子看一下兩種變數 類別型 自變數x ...
廣義線性模型
之前提到過,線性回歸模型有三個限制 響應變數服從正態分佈,響應變數和解釋變數之間服從線性關係,方差不變。其實在構建乙個線性模型的時候,除了上述的兩個要求,我們還需要對解釋變數進行具體的分析,主要有幾點,首先是解釋變數之間的相互作用 interaction 對結果的影響,簡單來說就是模型不僅僅受因素a...
scikit learn廣義線性模型之嶺回歸
嶺回歸 ridge regression 是一種專用於共線性資料分析的有偏估計,實質上就是一種改良的最小二乘法。我們知道,最小二乘法是通過優化 而嶺回歸則是通過優化 通過,上面兩個公式可以發現其實嶺回歸只是在平方差的後面加一項。其實,這就是我們所說的正則化,常見的正則化有l1正則化和l2正則化還有將...