拉格朗日對偶函式 拉格朗日對偶問題

2021-09-23 01:49:17 字數 3359 閱讀 5808

前段時間學了拉格朗日乘子法,學會了構造拉格朗日函式,也就是學會了把帶約束(等式或不等式)的優化問題轉化為無約束優化問題,私以為這部分就學完了到此為止了,沒想到今天推導svm的數學模型,要推原問題的對偶問題,愣是艱難地卡了大半天,一直沒明白對偶問題的含義,原來拉格朗日函式得到以後還要進一步往下推出拉格朗日對偶函式,對偶函式的極值問題就是原問題的對偶問題,本文專門梳理和總結一下,以作學習記錄。

本文是此文的續集,需要補充前面的知識可去逛逛,本文有的地方沒仔細解釋。

考慮最優化模型:

min ⁡f

(x)s

.t.h

k(x)

=0,g

j(x)

≤0j=

1,2…

,n;k

=1,2

…,

l\min f(x) \quad s.t.\quad h_k(x)=0\quad,\quad g_j(x)\leq0\quad j=1,2\ldots,n;k=1,2\ldots,l

minf(x

)s.t

.hk​

(x)=

0,gj

​(x)

≤0j=

1,2…

,n;k

=1,2

…,l引入鬆弛變數 / kkt乘子μj(

μj≥0

)\mu_j(\mu_j\geq0)

μj​(μj

​≥0)

,把不等式約束條件轉化為等式約束條件

引入拉格朗日乘子λ

k\lambda_k

λk​,把等式約束轉化為無約束優化問題。 l(x

,λ,μ

)=f(

x)+∑

k=1l

λkhk

(x)+

∑j=1

nμjg

j(x)

,μj≥

0\boldsymbol l(x,\boldsymbol \lambda,\boldsymbol\mu)=f(x)+\sum_^l\lambda_kh_k(x)+\sum_^n\mu_jg_j(x),\mu_j\geq0

l(x,λ,

μ)=f

(x)+

k=1∑

l​λk

​hk​

(x)+

j=1∑

n​μj

​gj​

(x),

μj​≥0g(

λ,μ)

=inf⁡x

(l(x

,λ,μ

))

g(\boldsymbol\lambda,\boldsymbol\mu)=\inf_(\boldsymbol l(x,\boldsymbol\lambda,\boldsymbol\mu))

g(λ,μ)

=xinf​(l

(x,λ

,μ))

inf 表示下確界,infimum(sup,上確界,supremum)

它只是λ,μ

\boldsymbol\lambda,\boldsymbol\mu

λ,μ的函式,與x

xx無關。

它一定是凹函式。這裡有證明。

原問題是最小化f(x

)f(x)

f(x)

,顯然,f(x

)≥l(

x,λ,

μ)

f(x)\geq \boldsymbol l(x,\boldsymbol\lambda,\boldsymbol\mu)

f(x)≥l

(x,λ

,μ)假設f

∗f^*

f∗是滿足原問題約束下的最優解,則

f ∗=

min⁡f(

x)

≥min⁡l

(x,λ

,μ)≥

g(λ,

μ),μ

i≥

0f^*=\min f(x)\geq\min \boldsymbol l(x,\boldsymbol\lambda,\boldsymbol\mu)\geq g(\boldsymbol\lambda,\boldsymbol\mu) ,\mu_i\geq0

f∗=minf(

x)≥minl(

x,λ,

μ)≥g

(λ,μ

),μi

​≥0所以g(λ

)g(\boldsymbol\lambda,\boldsymbol\mu)

g(λ,μ)

是原問題最優解的下界。

找下界當然是要找最大的下界,所以匯出拉格朗日對偶問題

max ⁡g

(λ,μ

),s.

t.μi

≥0

\max g(\boldsymbol\lambda,\boldsymbol\mu), s.t.\quad\mu_i\geq0

maxg(λ

,μ),

s.t.

μi​≥

0由於g(λ

)g(\boldsymbol\lambda,\boldsymbol\mu)

g(λ,μ)

一定是凹函式,所以拉格朗日對偶問題一定是凸優化問題。

原問題的關於x

xx的最小化轉化為了對偶問題關於λ,μ

\boldsymbol\lambda,\boldsymbol\mu

λ,μ的最大化。

設d

∗d^*

d∗是拉格朗日對偶問題的最優解,則不管原問題是不是凸優化問題,都一定有

d ∗=

f∗

d^*= f^*

d∗=f

∗則強對偶成立。這時對偶函式是原問題的緊緻下界。

d ∗≤

f∗

d^*\leq f^*

d∗≤f

∗則弱對偶成立。

能不能取到強對偶條件取決於目標函式和約束條件的性質。如果滿足原問題是凸優化問題,並且至少存在乙個絕對可行點(slater』s condition)(乙個可以讓所有不等式約束都不取等號的可行點),那麼就具有強對偶性。

slater條件:存在x,使得所以不等式約束g(x

)≤

0g(x)\leq0

g(x)≤0

嚴格成立(即嚴格小於)。

slater條件性質: slater條件是原問題p可以等價於對偶問題q的乙個充分條件,該條件確保了鞍點的存在。

拉格朗日對偶

參考 說下自己的理解。使用對偶是為了更容易求解,使min max f w,a,b 設為p 轉化為 max min f w,a,b 設為d d p 當等號成立時,最優解相同。若等號成立,則f w,a,b 必為馬鞍面,既凸又凹。滿足kkt條件等號可成立。當約束g 0時,a 0,這樣的點才是支援向量。先將...

拉格朗日對偶

優化理論中,目標函式f x 有多種形式 目標函式和約束條件都是x的線性函式,稱最優化問題為線性規劃 目標函式為二次函式,約束條件為線性函式,稱最優化問題為二次規劃 目標函式或約束條件為非線性函式,稱最優化問題為非線性規劃。每個線性規劃問題都有對應的對偶問題,對偶問題性質 對偶問題的對偶是原問題 原始...

拉格朗日對偶,KKT,SVM

機器學習通常轉化為數學規劃問題,拉格朗日對偶是求解帶有約束的凸規劃的乙個重要的技巧。這篇文章從先從理論的角度,介紹拉格朗日對偶的基本思想,在從支援向量機的推導上,應用上面提及的定理。對於上面的問題,原問題是一般的數學規劃,此時並不要求目標函式和約束中為凸函式。對於任意的數學規劃,如問題p,都會存在乙...