邏輯斯諦回歸模型

2021-10-03 08:48:26 字數 2397 閱讀 4868

logistic分布函式形式:

在該方程式中,x是隨機變數,μ是平均值,s是與標準偏差成比例的比例引數。這個方程我們只需要了解,在邏輯回歸模型中真正用到的是sigmoid函式:

當上式中的μ = 0,s = 1時,即為sigmoid函式:

s (z

)=11

+e(−

z)s(z) = \frac}

s(z)=1

+e(−

z)1​

邏輯回歸(logistic regression)是一種用於解決二分類(0 or 1)問題的機器學習方法,用於估計某事件發生的可能性。可以看到,雖然帶有回歸二字,但是邏輯回歸模型是一種分類模型。

邏輯回歸與線性回歸有密不可分的關係:

1.邏輯回歸與線性回歸都是一種廣義線性模型。

2.邏輯回歸假設因變數 y 服從伯努利分布(二項分布),而線性回歸假設因變數 y 服從高斯分布(正態)。

3.如果去除sigmoid對映函式的話,邏輯回歸演算法就是乙個線性回歸。可以說,邏輯回歸是以線性回歸為理論支援的,但是邏輯回歸通過sigmoid函式引入了非線性因素,因此可以輕鬆處理0/1分類問題。

上面介紹了sigmod函式:

s (z

)=11

+e(−

z)s(z) = \frac}

s(z)=1

+e(−

z)1​

其影象為:

sigmoid函式又稱s形函式,值域在[0, 1]之間,在距離0比較遠的地方函式的值會無限逼近0或者1。這個性質很適用於解決二分類問題。

定義 (邏輯斯諦回歸模型):二項邏輯斯諦回歸模型是如下的條件概率分布:

p (y

=1∣x

)=hθ

(x)=

11+e

−(θ⋅

x+b)

p(y = 1 | x) = h_θ(x) = \frac}

p(y=1∣

x)=h

θ​(x

)=1+

e−(θ

⋅x+b

)1​p(y

=0∣x

)=1−

p(y=

1∣x)

=11+

e(θ⋅

x+b)

p(y = 0 | x) = 1 - p(y = 1 | x) = \frac}

p(y=0∣

x)=1

−p(y

=1∣x

)=1+

e(θ⋅

x+b)

1​這裡x ∈r

nx∈r^n

x∈rn

是輸入,y∈0

,1y∈y∈

0,1是輸出,θ∈r

nθ∈r^n

θ∈rn

和b ∈r

b∈rb∈

r是引數。θ稱為權值向量,b稱為偏置,θ⋅x

θ ·x

θ⋅x為θ

θθ 和x

xx的內積。

下面看該模型的乙個特點:

對邏輯斯諦回歸而言,

l og

p(y=

1∣x)

1−p(

y=1∣

x)=θ

⋅x+b

log\frac = θ ·x+b

log1−p

(y=1

∣x)p

(y=1

∣x)​

=θ⋅x

+b這一步很好推導,把上面定義中的式子代入,根據對數函式的性質就能求得。

這就是說,在邏輯斯諦回歸模型中,輸出y =1的對數機率是輸入x的線性函式.或者說,輸出y =1的對數機率是由輸入x的線性函式表示的模型,即邏輯斯諦回歸模型。

不同於線性回歸模型的均方誤差損失函式,邏輯回歸模型採用交叉熵作為損失函式:

符號說明:

通俗來講,交叉熵是對「出乎意料」(譯者注:原文使用suprise)的度量。當輸出是我們期望的值,我們的「出乎意料」程度比較低;當輸出不是我們期望的,我們的「出乎意料」程度就比較高。至於交叉熵損失函式的詳細解釋,這裡。

2.《統計學習方法》李航

邏輯斯諦回歸

先介紹乙個分布 邏輯斯諦分布。設 x 是連續隨機變數,且 x 具有以下分布函式和概率密度 f x p x leq x frac f x f x frac 其中,mu 是隨機變數的數學期望,lambda 0 是形狀引數。由圖可以看出,邏輯斯諦分布和高斯分布的密度函式長得差不多。特別注意邏輯斯諦分布的概...

邏輯斯諦回歸學習總結

邏輯斯諦回歸模型是對數線性模型的推理 邏輯斯諦分布函式f x p x x 11 e x 邏輯斯諦的密度函式是f x f x e x 1 e x 2該曲線以點 12 為中心對對稱。曲線在中心附近增長速度較快,在兩端增長速度較慢。的值越小,曲線在中心附近增長得越快。二項邏輯斯諦回歸模型的條件概率分布 p...

邏輯斯諦回歸與最大熵模型 分類 監督方法

英國政治經濟學家馬爾薩斯在1789年提出了第乙個描述種群增長的馬爾薩斯人口增長模型,如下所示,y t 為種群中的個體數量,是時間t的函式,k為比例常數 也稱內生增長率 跟環境有關。dy dt k y y ekt dyd t ky y e kt 該模型中假設在無侷限的環境下,養分充足,沒有天敵,種群免...