邏輯回歸線性回歸最小二乘極大似然梯度下降

機器學習的基本框架大都是模型、目標和演算法！

重要的事情說三遍！

對於乙個資料集，首先你要根據資料的特點和目的來選擇合適模型。

就你問的而言，選定的模型是logistic regression。現在既然已經選擇了模型，那麼接下來的問題是：怎麼才能讓這個模型盡可能好的擬合或者分類資料呢？那麼就需要有目標，所以要定下模型的cost function，但是cost function怎麼定呢？憑直覺隨便選嗎！不！可！能！

我們都知道，linear regression的cost function是最小二乘，即

但是logistic regression的cost function卻是

為什麼logistic regression不使用最小二乘做cost function呢？

答案是各自的響應變數

在linear regression中，前提假設是

因而，在用極大似然估計計算時，所得到的cost function自然是不一樣的。(可自行推導)

然而，只有目標是沒用的，我們還要有方法來達到目標，這裡的方法就是上述的演算法——最優化演算法。包括常用的梯度下降法(最速下降法)、牛頓法、擬牛頓法等。這樣，乙個機器學習演算法就算完整了，因為可以用這些最優化演算法來

所以！結論是：三者完全沒有可比性！

由一些前提假設和

極大似然估計從概率的角度推導出了cost function（linear中是

最小二乘，logistic中是對數似然），而

梯度下降只是乙個最優化演算法，用來優化cost function的。

邏輯回歸 線性回歸 最小二乘 極大似然 梯度下降