lr的優缺點
優點 一、**結果是界於0和1之間的概率;
二、可以適用於連續性和類別性自變數;
三、容易使用和解釋;
缺點 一、對模型中自變數多重共線性較為敏感,例如兩個高度相關自變數同時放入模型,可能導致較弱的乙個自變數回歸符號不符合預期,符號被扭轉。需要利用因子分析或者變數聚類分析等手段來選擇代表性的自變數,以減少候選變數之間的相關性;
二、**結果呈「s」型,因此從log(odds)向概率轉化的過程是非線性的,在兩端隨著log(odds)值的變化,概率變化很小,邊際值太小,slope太小,而中間概率的變化很大,很敏感。 導致很多區間的變數變化對目標概率的影響沒有區分度,無法確定閥值。
5、lr和svm
1、lr採用log損失,svm採用合頁損失。
2、lr對異常值敏感,svm對異常值不敏感。
3、在訓練集較小時,svm較適用,而lr需要較多的樣本。
4、lr模型找到的那個超平面,是盡量讓所有點都遠離他,而svm尋找的那個超平面,是只讓最靠近中間分割線的那些點盡量遠離,即只用到那些支援向量的樣本。
5、對非線性問題的處理方式不同,lr主要靠特徵構造,必須組合交叉特徵,特徵離散化。svm也可以這樣,還可以通過kernel。
6、svm 更多的屬於非引數模型,而logistic regression 是引數模型,本質不同。其區別就可以參考引數模型和非參模型的區別
那怎麼根據特徵數量和樣本量來選擇svm和lr模型呢?andrew ng的課程中給出了以下建議:
如果feature的數量很大,跟樣本數量差不多,這時候選用lr或者是linear kernel的svm
如果feature的數量比較小,樣本數量一般,不算大也不算小,選用svm+gaussian kernel
如果feature的數量比較小,而樣本數量很多,需要手工新增一些feature變成第一種情況。(lr和不帶核函式的svm比較類似。)
參考文獻:機器學習演算法系列(3):邏輯斯諦回歸/
剛構橋的優缺點 橋梁的優缺點
梁式橋 主梁為主要承重構件,受力特點為主梁受彎。主要材料為鋼筋混凝土 預應力混凝土,多用於中小跨徑橋梁。簡支梁橋合理最大跨徑約 公尺,懸臂梁橋與連續梁橋合宜的最大跨徑約 60 70 公尺。優點 採用鋼筋砼建造的梁橋能就地取材 工業化施工 耐久性好 適應性強 整體性好且 美觀 這種橋型在設計理論及施工...
演算法的優缺點 邏輯回歸演算法的優缺點
邏輯回歸演算法是最經典的幾個機器學習演算法之一,本文對它的優點,缺點進行總結。sigmoid函式 表示式如下 1.實現簡單,廣泛的應用於工業問題上 2.分類時計算量非常小,速度很快,儲存資源低 3.便利的觀測樣本概率分數 4.對邏輯回歸而言,多重共線性並不是問題,它可以結合l2正則化來解決該問題 5...
Struts的優缺點
struts是開源軟體,使開發者能更深入的了解其內部實現機制。struts 優點 業界 標準 很多成功案例 學習資源豐富。struts的優點主要集中體現在兩個方面 taglib和頁面導航。a 利用struts提供的taglib可以大大節約開發時間。b 維護擴充套件比較方便。通過乙個配置檔案,即可把握...