regression與線性回歸(linear regression)
線性回歸(linear regression):
損失函式(loss function)
我們要找到最好的權重/引數θ
怎麼去衡量「最好」? 定義損失函式
最小化損失函式 梯度下降(gradient descend)
逐步最小化損失函式的過程
如同下山,找準方向(斜率),每次邁進一小步,直至山底
找到合適的學習率(步長),再進行訓練,否則特徵多,樣本的多的情況下成本會很大的。
數學和工程區別是工程找到大致可用的就可以了,數學是找打最優解。
特徵的工作,耗時很多。
工業界最多的解決的是分類問題。
線性回歸不適合做分類,不夠堅定,受雜訊影響大。
用得到的y值劃定閾值來分類
邏輯回歸:把負無窮到正無窮壓縮到0~1之間(可以看作概率域分布)
常用sigmoid函式對映
把線性回歸轉變成分類問題,找出一條判定邊界
線性的判定邊界
機器學習中分類任務tricks總結
計算機視覺主要問題有影象分類 目標檢測和影象分割等。針對影象分類任務,提公升準確率的方法路線有兩條,乙個是模型的修改,另乙個是各種資料處理和訓練的技巧 tricks 影象分類中的各種技巧對於目標檢測 影象分割等任務也有很好的作用,因此值得好好總結。影象分類任務的各種tricks如下 學習率是神經網路...
機器學習中分類和聚類的區別
在機器學習中有兩種常見的任務 分類 classification 和聚類 clustering 在初學機器學習時,對這兩個概念的理解容易混淆,隨著學習的深入,對這兩個概念有了基本的認識,現總結如下 1.分類 屬於監督學習的範疇,根據一些給定的已知類別的樣本,使它能夠對未知類別的樣本進行分類,要求必須...
機器學習中分類模型的評估方法之 Kappa係數
k po pe 1 pe 其中,p0表示為總的分類準確度 pe表示為 pe a1 b1 a2 b2 ac bc n n 其中,ai代表第i類真實樣本個數,bi代表第i類 出來的樣本個數。例子對於該表中的資料,則有 po 239 73 280 664 0.8916 pe 261 276 103 93 ...