第7章優化演算法

實際上，機器學習演算法 = 模型表徵 + 模型評估 + 優化演算法

1 有監督學習的算是函式

~~~~~~~

機器學習演算法的關鍵一環是模型評估，而損失函式定義了模型的評估指標。可以說，沒有損失函式就無法求解模型引數。不同的損失函式優化難度不同，最終得到的模型引數也不同，針對具體的問題需要選取合適的損失函式。

問題：有監督學習涉及的損失函式有哪些?請列舉並簡述他們的特點

絕對損失函式相當於是在做中值回歸，相比做均值回歸的平方損失函式，絕對損失函式對異常點更魯棒一些

2 機器學習中的優化問題

知識點：凸優化基本概念

問題：機器學習中的優化問題，哪些是優化問題，哪些是非凸優化問題？

~~~~~~~

邏輯回歸，對應的優化問題就是凸優化問題，其他凸優化問題的例子包括支援向量機、線性回歸等線性模型。

~~~~~~~

主成分分析對應的優化問題是非凸優化問題，非凸優化問題的例子包括低秩模型（如矩陣分解）、深度神經網路模型等。

3 經典優化演算法

問題：無約束優化問題的優化方法有哪些？

~~~~~~~

經典的優化演算法可以分為直接法和迭代法兩大類。

~~~~~~~

直接法，顧名思義，就是能夠直接給出優化問題最優解的方法。這個方法聽起來非常厲害的樣子，但它不是萬能的。直接法要求目標函式需要滿足兩個條件。第乙個條件是，l(·)是凸函式。若l(·)是凸函式，那麼θ是最優解的充分必要條件是l(·)在θ處的梯度為0，

~~~~~~~

一階法：梯度下降法。二階法：牛頓法

4 梯度驗證

問題：如何驗證求目標函式梯度功能的正確性？

5 隨機梯度下降演算法

問題：當訓練資料量特別大時，經典的梯度下降法存在什麼問題，需要做如何改進？

6 隨機梯度下降法的加速

問題1：隨機梯度下降法失效的原因——摸著石頭下山

問題2：解決之道——慣性保持和環境感知

7 l1正則化與稀疏性

問題1：l1正則化使得模型引數具有稀疏性的原理是什麼？

第7章 優化演算法