分類:
概念:對於分類問題,監督學習從資料中學習乙個分類模型或者分類決策函式,稱為分類器。分類器對新的輸入**其屬於哪一類別,稱為分類。
優化過程:找到最優決策面
輸出:離散值,如0/1,yes/no
評價指標:一般是精確率,即給定測試資料集,分類器能正確分類的樣本數佔總樣本數的比。
模型損失函式:交叉熵損失函式
回歸:概念:回歸用於**輸入變數和輸出變數之間的關係,特別是當輸入變數的值發生變化時,輸出變數的值也會跟著變化。回歸模型正是表示輸入變數到輸出變數之間的對映函式,回歸問題的學習等價於函式擬合。
優化過程:使得學習到的函式曲線跟真實曲線擬合的最好
輸出:連續值,如房子的售價,天氣溫度
評價指標:根據回歸任務的不同而不同,對於影象復原問題,評價指標有ssim/psnr等
模型損失函式:常用的是均方誤差,即**輸出和標籤的
因此,分析分類模型和回歸模型的不同,可以從其輸出型別、優化過程、損失函式、評價指標等方面著手進行對比。
樹模型 分類還是回歸
gbdt是一種用於回歸的機器學習演算法,也可以用於分類,該演算法由多棵回歸決策樹組成,所有樹的結論累加起來做最終答案。當把目標函式做變換後,該演算法亦可用於分類或排序。隨機森林能夠解決分類與回歸兩種型別的問題,雖然rf能做回歸問題,但通常都用rf來解決分類問題 隨機森林在解決回歸問題時,並沒有像它在...
分類和回歸 一 線性模型
分類和回歸 spark.mlib提供了多種方法用於用於二分類 多分類以及回歸分析。下表介紹了每種問題型別支援的演算法。問題型別 支援方法 二分類線性svms 邏輯回歸 決策樹 隨機森林 梯度增強樹 樸素貝葉斯 多分類邏輯回歸 決策樹 隨機森林 樸素貝葉斯 回歸線性最小二乘法 決策樹 隨機森林 梯度增...
回歸和分類區別,及模型的選擇
本文主要介紹了回歸問題與分類問題的不同應用場景以及它們訓練演算法的不同之處 回歸問題通常是用來 乙個值,如 房價 未來的天氣情況等等,例如乙個產品的實際 為500元,通過回歸分析 值為499元,我們認為這是乙個比較好的回歸分析。乙個比較常見的回歸演算法是線性回歸演算法 lr 另外,回歸分析用在神經網...