在機器學習中,種類最多的一類演算法要屬很類演算法,本文對機器學習中的各種分類演算法的優缺點做乙個總結。
所需估計的引數少,對於缺失資料不敏感。
有著堅實的數學基礎,以及穩定的分類效率。
假設屬性之間相互獨立,這往往並不成立。(喜歡吃番茄、雞蛋,卻不喜歡吃番茄炒蛋)。
需要知道先驗概率。
分類決策存在錯誤率。
不需要任何領域知識或引數假設。
適合高維資料。
簡單易於理解。
短時間內處理大量資料,得到可行且效果較好的結果。
能夠同時處理資料型和常規性屬性。
對於各類別樣本數量不一致資料,資訊增益偏向於那些具有更多數值的特徵。
易於過擬合。
忽略屬性之間的相關性。
可以解決小樣本下機器學習的問題。
提高泛化效能。
可以解決高維、非線性問題。超高維文字分類仍受歡迎。
避免神經網路結構選擇和區域性極小的問題。
對缺失資料敏感。
記憶體消耗大,難以解釋。
執行和調差略煩人。
思想簡單,理論成熟,既可以用來做分類也可以用來做回歸。
可用於非線性分類。
訓練時間複雜度為o(n)。
準確度高,對資料沒有假設,對outlier不敏感。
計算量太大。
對於樣本分類不均衡的問題,會產生誤判。
需要大量的記憶體。
輸出的可解釋性不強。
運算速度快。
簡單易於理解,直接看到各個特徵的權重。
能容易地更新模型吸收新的資料。
如果想要乙個概率框架,動態調整分類閥值。
特徵處理複雜。需要歸一化和較多的特徵工程。
分類準確率高。
並行處理能力強。
分布式儲存和學習能力強。
魯棒性較強,不易受雜訊影響。
需要大量引數(網路拓撲、閥值、閾值)。
結果難以解釋。
訓練時間過長。
adaboost是一種有很高精度的分類器。
可以使用各種方法構建子分類器,adaboost演算法提供的是框架。
當使用簡單分類器時,計算出的結果是可以理解的。而且弱分類器構造極其簡單。
簡單,不用做特徵篩選。
不用擔心overfitting。
對outlier比較敏感
常見機器學習演算法優缺點
1 線性模型 形式簡單 易於建模 很好的可解釋性 2 邏輯回歸 無需事先假設資料分布 可得到近似概率 對率函式任意階可導的凸函式,許多數值優化演算法都可直接用於求取最優解 3 線性判別分析 lda 當兩類資料同先驗 滿足高斯分布且協方差相等時,lda可達到最優分類 4 boosting 代表adab...
機器學習中各分類演算法的優缺點比較
文章 1決策樹 decision trees 的優缺點 決策樹的優點 一 決策樹易於理解和解釋.人們在通過解釋後都有能力去理解決策樹所表達的意義。二 對於決策樹,資料的準備往往是簡單或者是不必要的.其他的技術往往要求先把資料一般化,比如去掉多餘的或者空白的屬性。三 能夠同時處理資料型和常規型屬性。其...
機器學習中常見的演算法的優缺點之決策樹
決策樹在機器學習中是乙個十分優秀的演算法,在很多技術中都需要用到決策樹這一演算法,由此可見,決策樹是乙個經典的演算法,在這篇文章中我們給大家介紹決策樹演算法的優缺點,希望這篇文章能夠更好的幫助大家理解決策樹演算法。那麼決策樹自身的優點都有什麼呢,總結下來就是有六點,第一就是決策樹易於理解和解釋,可以...