邏輯回歸是一種分類演算法,和之前的線性回歸不是同一類問題,但是對於處理問題上有相同的思想。 對於線性回歸問題,有較容易理解的思路。首先指定乙個形式確定的 hθ
(x)=
θtx
然後根據所有樣本計算代價函式,距離的平方取平均再乘個係數: j(
θ)=1
2m∑m
i=1(
hθ(x
(i))
−y(i
))2
簡單的理解就是根據假設函式得出的結果與實際樣本的「遠近」程度。我們希望求出代價函式最小值所在點對應向量
θ 。之後將
θ 帶入到假設函式中,就得到較好的擬合結果。而代價函式中唯一的變數就是
θ ,所以可以通過求導(偏導數)的方法求出
θ 。
而邏輯回歸的假設函式不再是簡單的 hθ
(x)=
θtx
而是更適合用於之後數學計算過程的 hθ
(x)=
g(θt
x)該假設函式的性質較特殊,可以最終通過判斷θt
x的正負來得出y=0或1。h(x)改變了,代價函式也跟著改變:根據樣本的y=0或1有兩段函式(涉及到log等,十分巧妙),同樣的,我們希望求出代價函式的最小值對應的
θ ,由於
θ 是代價函式的唯一變數,可以求導(偏導)得到,經過求導,非常非常巧合,導函式的形式和線性回歸一致(但是本質不一致,因為假設函式就完全不同),所以可以用梯度下降的方法求出來最小值,以及對應的
θ 。 hθ
(x) 的形式,然後確定 j(
θ)的形式, 再通過代入所有的樣本,得到j(
θ)的具體表示式。最後求j(
θ)的最小值,以及對應的
θ , 放回hθ
(x) 中,得出結論。
機器學習 高階演算法課程學習總結
作為乙個機器學習方面的小白,在閔老師課上學的兩個聚類演算法,即經典的k means聚類和基於隨機遊走的聚類演算法,是我學習到的頭兩個與機器學習相關的演算法。演算法課上,閔老師先講了簡單但是經典的k means聚類演算法,讓我們對聚類演算法有了乙個初步的理解,緊接著又花了大量的時間剖析了基於隨機遊走的...
Google機器學習課程 機器學習術語
監督式 機器學習定義 機器學習系統通過學習如何組合輸入資訊來對從未見過的資料做出有用的 標籤是我們要 的事物,即簡單線性回歸中的 y 變數。特徵是輸入變數,即簡單線性回歸中的 x 變數。樣本是指資料的特定例項 x 模型定義了特徵與標籤之間的關係。訓練是指建立或學習模型。也就是說,向模型展示有標籤樣本...
機器學習專案階段
2.資料預處理。資料處理大概會佔到整個50 70 的工作量,通過資料洗清 分詞 詞性標註 去停用詞四個大的方面來完成語料的預處理工作。3.特徵工程。做完語料預處理之後,接下來需要考慮如何把分詞之後的字和詞語表示成計算機能夠計算的型別。把中文分詞的字串轉換成數字,有兩種常用的表示模型分別是詞袋模型和詞...