q:什麼是分類器?
a:就是用來把輸入的資料進行分類的模型(本質上是函式)。
圖1,黑色的曲線就是非線性分類器。以曲線的形式分類了紅點和藍點。
圖2,黑色的直線就是線性分類器。以直線的形式分類紅點和藍點。
一、線性分類器
以上圖的二分類(紅點和藍點)為例:
線性分類器就是用乙個「超平面」將兩個樣本隔離開,如:
常見的線性分類器有:lr,貝葉斯分類,單層感知機、線性回歸,svm(線性核)等等。
優點缺點
線性分類器速度快、程式設計方便且便於理解
但是擬合能力低
二、非線性分類器
以上圖的二分類(紅點和藍點)為例:
非線性分類器就是用乙個「超曲面」或者多個超平(曲)面的組合將兩組樣本隔離開(不屬於線性的分類器),如:
常見的非線性分類器:決策樹、rf、gbdt、多層感知機、svm(高斯核)等等。
優點缺點
非線性分類器擬合能力強
但是程式設計實現較複雜,理解難度大
三、總結
綜上,我們可以得出,區分線性分類器與非線性分類器的標準是決策邊界(decision boundary)的不同
思考:為什麼說邏輯回歸lr是線性分類器?
我們以二分類(0類、1類)為例:
總結:雖然邏輯回歸模型特徵經過非線性函式sigmoid的轉換,但是它的決策邊界是線性方程,所以邏輯回歸lr是非常典型的線性分類器。
決策邊界的由來:決策邊界上的樣本被劃分為正負樣本的概率相等,即p(y=1|x,w) = p(y=0|x,w)得到,移項相除,兩邊取對數。
參考
線性分類器和非線性分類器
線性和非線性的區別 1.線性linear,指量與量之間按比例 成直線的關係,在數學上可以理解為一階導數為常數的函式 非線性non linear則指不按比例 不成直線的關係,一階導數不為常數。2.線性的可以認為是1次曲線,比如y ax b 即成一條直線 非線性的可以認為是2次以上的曲線,比如y ax ...
機器學習總結之 線性分類器與非線性分類器
1 線性分類器 1.1線性分類器的定義 線性分類器就是用乙個 超平面 將正 負樣本隔離開,如 1 二維平面上的正 負樣本用一條直線來進行分類 2 三維立體空間內的正 負樣本用乙個平面來進行分類 3 n維空間內的正負樣本用乙個超平面來進行分類。1.2常見的線性分類器 常見的線性分類器有 lr,貝葉斯分...
3 線性分類器與非線性分類器的區別與優劣?
首先線性和非線性是針對模型引數和輸入特徵來講的 比如輸入x,模型y ax ax 2那麼就是非線性模型,如果輸入是x和x 2則模型是線性的。再看定義考慮二類的情形,所謂線性分類器即用乙個超平面將正負樣本分離開,表示式為 y wx 這裡是強調的是平面。而非線性的分類介面沒有這個限制,可以是曲面,多個超平...