轉 用ADMM求解大型機器學習問題

2022-07-08 17:27:20 字數 1039 閱讀 1184

。對應上面的對偶上公升方法,得到下面的乘子法(method of multipliers)

注意,乘子法里把第二個式子裡的αk

改成了擴充套件拉格朗日表示式中引入的ρ

。這不是乙個隨意行為,而是有理論依據的。利用l(x,y)

可以匯出上面最小化問題對應的原始和對偶可行性條件分別為(∂l∂y=0

,∂l∂x=0

。從上面可知,這種yk+1

的取法使得(xk+1,yk+1)

滿足對偶可行條件∂l∂x=0

。而原始可行條件在迭代過程中逐漸成立。

乘子法弱化了對偶上公升法的收斂條件,但由於在x-minimization步引入了二次項而導致無法把x分開進行求解(詳見[1])。而接下來要講的alternating direction method of multipliers (admm)

和z放一塊求解,而admm是分開求解,類似迭代一步的gauss-seidel方法。其中(3.4)中的推導類似於乘子法,只是使用了zk+1

最小化lρ(xk+1,z,yk)

定義新變數u=1ρy

和u中使用下面的表示式代替其中的axk+1

, 其中αk

為relaxation因子。有實驗表明αk∈[1.5,1.8]

可以改進收斂性([2])。

, 其中x

為模型引數,fj(x)

對應第j

個樣本的損失函式,而g(x)

為懲罰係數,如g(x)=||x||1

。假設把j

個樣本分成n

塊,還額外加了n

個等式約束,使得利用每塊樣本計算出來的模型引數xi

,g(z)=λ||z||1

,y¯的定義類似。

在分布式情況下,為了計算方便通常會把u

的更新步驟挪在最前面,這樣u

和x的選取

:停止準則主要考量的是xi

和z之間的差異和它們本身的變動情況,但這些值又受ρ

:α求解逐漸精確的策略可以降低xi

更新時的耗時,但也使得演算法更加複雜,需要設定的引數也增加了。

IBM 大型機培訓課程分析

主要課程簡介 1.os 390 ibm的乙個作業系統 4.cobol 面向商業的通用語言,又稱為企業管理語言 資料處理語言等,common business oriented langauge 是最早的高階程式語言之一,是世界上第乙個商用語言。在計算機的應用領域中,資料處理是應用最廣泛的乙個領域。資...

IBM 大型機培訓課程分析

主要課程簡介 1.os 390 ibm的乙個作業系統 4.cobol 面向商業的通用語言,又稱為企業管理語言 資料處理語言等,common business oriented langauge 是最早的高階程式語言之一,是世界上第乙個商用語言。在計算機的應用領域中,資料處理是應用最廣泛的乙個領域。資...

重新發現大型機

全球業務環境既多種多樣又靈活多變,受到客戶需求 監管和社會政治問題的影響。每年,ibm 都在全球範圍面向1400多名企業管理者展開年度調查,什麼是當今世界所面臨的重要問題。在2005年,人們認為收入上限是首要問題,然後是贏利能力以及成本控制。接受調查的管理者表示,為了解決上述問題,主要需要做到改善業...