logistic回歸 簡介 邏輯回歸 理論簡介

2021-10-11 06:39:31 字數 2397 閱讀 2023

邏輯回歸logistic regression——分類演算法原理簡介_嗶哩嗶哩 (゜-゜)つロ 乾杯~-bilibili​www.bilibili.com

如果某個函式可以用半開區間的指示函式的有限次線性組合來表示,那麼這個函式就是階躍函式。階躍函式是有限段分段常數函式的組合。

然而邏輯回歸是乙個概率模型,我們需要的輸出結果在(0,1)(0,1)之間,所以需要乙個「對映函式」:邏輯回歸中常用的對映函式就是sigmoid函式

但是,邏輯回歸的目標是解決二分類問題,在得到了乙個概率值之後還需要對這個概率值進行「分類」。當概率值大於0.5時把樣本歸為正類、當概率值小於0.5時把樣本歸為負類。

累計分布函式:

概率密度函式:

其中μ表示位置引數,s表示形狀引數。形狀類似正態分佈、但峰度更高、尾部更長。

我們已經確定好邏輯回歸的數學表達形式了:階躍函式+對映函式,那麼接下來就是如何去求解模型中的引數,確定最優決策邊界。

二項logistic回歸模型是一種由條件概率分布p(y|x)表示的分類模型,以n維隨機變數x為輸入,y∈為輸出:

其中w也是乙個n維的權值向量,b為偏置。logistic回歸只需要比較這兩個條件概率值的大小,選擇概率較大的那一類即可

但是,上述式子仍顯累贅。若令

,那麼上面兩式可以轉化為:

統計學中,機率表示事件發生的概率p與事件不發生的概率1−p的比值

。在logistic回歸模型中,機率取對數後表示為:

也就是說,在logistic回歸模型中,輸出y=1的對數機率是輸入x的線性函式。

- 若線性函式趨近正無窮,概率值p(y=1|x)就越接近1,

- 若線性函式趨近負無窮,概率值p(y=1|x)就越接近0。

邏輯回歸的主要思想就是:先擬合決策邊界、然後由對映函式建立邊界與分類概率的聯絡

已知一些樣本,需要尋找一組引數使得現有樣本出現概率最大化。

因為邏輯回歸假設之一是樣本服從伯努利分布,若令

則似然函式可表示為

對數似然:

用於衡量**值與實際值的偏離程度,損失函式的值越小表示分類器越精準。「最優引數」就是使得損失函式取最小值。

1. 0-1損失函式:**值與實際值不相等為1,相等為0.直接判斷錯分的個數。

2. 平方損失函式:誤差平方和,常用於線性回歸。

3. 對數損失函式:常用於模型輸出時每一類概率的分類器,例如邏輯回歸。

4. hinge損失函式:分類正確損失為0,否則損失為1−yf(x),y=1或-1,f(x)∈(−1,1)1−yf(x),y=1或−1,f(x)∈(−1,1),常用於svm。

對數損失函式也叫交叉熵損失函式。代表某個事件的不確定性,交叉熵代表兩個概率分布(**與真實)之間的差異性。通過最小化交叉熵損失函式就可以最大化邏輯回歸分類器的精度。(補充:交叉熵損失的選取與最大熵模型有關)

表示式

將 代入上式:

對數似然與對數損失函式的關係:

通過損失函式loss對引數w求一階偏導來確定方向,並且確定步長α,來更新w:

直到 小於某個閾值或達到最大迭代次數停止。

在現有極小點估計值的附近對loss做二階泰勒展開,進而找到極小點的乙個估計值,設

為當前極小值估計值,那麼有:

然後令

,可以得到

訓練模型:輸入資料集為

,上式中只有θ這個向量是未知的。只要能夠找到乙個引數向量θ使得loss最小,那麼這個θ就是

最優的引數向量。

使用模型:將得到的最優θ帶入

,然後根據乙個閾值調整到0或1,就得到了樣本的所屬分類。

一些引用:

線性分類與非線性分類:

線性回歸與邏輯回歸對比圖:

階躍函式與sigmoid函式:

logistic回歸 簡介 softmax回歸

softmax邏輯回歸模型是logistic回歸模型在多分類問題上的推廣。在多分類問題中,類標籤y可以取兩個以上的值。softmax回歸模型對於諸如mnist手寫數字分類等問題是很有用的,該問題的目的是辨識10個不同的單個數字。描述 大小是,大小是。其中n是輸入個數,m是分類個數。這裡的是經過one...

logistic回歸 logistic回歸

logistic回歸 logistic回歸分析可用於估計某個事件發生的可能性,這是乙個分類模型而不是乙個回歸模型!它的基本思想是利用一條直線將平面上的點分為兩個部分,即兩個類別,要解決的問題就是如何擬合出這條直線,這個擬合的過程就稱之為 回歸 logistic模型 假設你有乙個需要 的內容,要通過三...

logit回歸模型假設 logistic回歸模型

標籤 一 模型簡介 線性回歸預設因變數為連續變數,而實際分析中,有時候會遇到因變數為分類變數的情況,例如陰性陽性 性別 血型等。此時如果還使用前面介紹的線性回歸模型進行擬合的話,會出現問題,以二分類變數為例,因變數只能取0或1,但是擬合出的結果卻無法保證只有這兩個值。那麼使用概率的概念來進行擬合是否...