logit回歸模型假設 logistic回歸模型

2021-10-21 22:45:02 字數 703 閱讀 2727

標籤:

一、模型簡介

線性回歸預設因變數為連續變數,而實際分析中,有時候會遇到因變數為分類變數的情況,例如陰性陽性、性別、血型等。此時如果還使用前面介紹的線性回歸模型進行擬合的話,會出現問題,以二分類變數為例,因變數只能取0或1,但是擬合出的結果卻無法保證只有這兩個值。

那麼使用概率的概念來進行擬合是否可以呢?答案也是否定的,因為

1.因變數的概率和自變數之間的關係不是線性的,通常呈s型曲線,並且這種曲線是無法通過曲線直線化進行處理的。

2.概率的取值應該在0-1之間,但是線性擬合的結果範圍是整個實數集,並不能保證一定在0-1之間。

基於以上問題,我們需要找出其他解決思路,那就是logit變換(邏輯變換),我們將某種結果出現的概率和不出現的概率之比稱為優勢比p/(1-p),將優勢比作為因變數,並且取其對數,這就是邏輯變換,通過邏輯變換使之與自變數之間呈線性關係,從而解決了上述問題1。同時也使得因變數的取值範圍覆蓋了整個實數集,也解決了上述問題2,我們將經過邏輯變換的線性模型稱為logistic回歸模型(邏輯回歸模型),可以看出,邏輯回歸也是一種線性回歸模型,屬於廣義線性回歸模型的範疇。

線性回歸是根據回歸方程**某個結果的具體值,而邏輯回歸則是根據回歸方程****某個結果出現的概率。

對因變數進行變換的方法很多,並不只

logit回歸模型假設 廣義線性模型與R實現

假設y是正態分佈,y的條件均值是 的線性函式 假定yi來自指數分布族,常見的正態分佈 二項分布 泊松分布 伽馬分布都是指數分布族 指數分布族的概率密度 注 泊松分布和二項分布的 1 為連線函式,一對一連續可導函式 由於連線函式為一對一,因此 沒有解析解,主要演算法有牛頓迭代和fisher得分法,具體...

線性回歸模型 線性回歸模型

回歸的思想和分類有所不一樣,分類輸出的結果為離散的值,回歸輸出的是乙個連續型的值。線性回歸的思想就是試圖找到乙個多元的線性函式 當輸入一組特徵 也就是變數x 的時候,模型輸出乙個 值y h x 我們要求這個 值盡可能的準確,那麼怎麼樣才能做到盡可能準確呢?其中 表示實際值,表示 值 其中 表示實際值...

經典線性回歸假設 課堂理解筆記

經典計量經濟學 clm 也稱經典線性模型。在經典線性回歸模型中,高斯 馬爾可夫假定對於最小二乘估計 ols 效果以及假設檢驗的成立及其重要。基本的假定總結起來主要有五個。首先基本線性模型形式如下 y 0 1 x 2 x nx y beta 0 beta 1x beta 2x beta nx epsi...