各種機器學習方法的優缺點

2022-08-02 05:51:09 字數 1426 閱讀 8845

樸素貝葉斯的優點:

對小規模的資料表現很好,適合多分類任務,適合增量式訓練。

缺點:對輸入資料的表達形式很敏感。

決策樹的優點:

計算量簡單,可解釋性強,比較適合處理有缺失屬性值的樣本,能夠處理不相關的特徵;

缺點:容易過擬合(後續出現了隨機森林,減小了過擬合現象);

logistic回歸優點:

1、實現簡單;

2、分類時計算量非常小,速度很快,儲存資源低;

缺點:1

、容易欠擬合,一般準確度不太高

2、只能處理兩分類問題(在此基礎上衍生出來的

softmax

可以用於多分類),且必須線性可分;

線性回歸優點:

實現簡單,計算簡單;

缺點:不能擬合非線性資料;

knn演算法的優點:

1. 思想簡單,理論成熟,既可以用來做分類也可以用來做回歸;

2. 可用於非線性分類;

3. 訓練時間複雜度為

o(n)

;4. 

準確度高,對資料沒有假設,對

outlier

不敏感;

缺點:1. 

計算量大;

2. 樣本不平衡問題(即有些類別的樣本數量很多,而其它樣本的數量很少);

3. 需要大量的記憶體;

svm演算法優點:

可用於線性/

非線性分類,也可以用於回歸;

低泛化誤差;

容易解釋;

計算複雜度較低;

缺點:對引數和核函式的選擇比較敏感;

原始的svm

只比較擅長處理二分類問題;

boosting演算法的優點:

低泛化誤差;

容易實現,分類準確率較高,沒有太多引數可以調;

缺點:對outlier

比較敏感;

k-means演算法的優點:(1)

k-means

演算法是解決聚類問題的一種經典演算法,演算法簡單、快速。

(2)對處理大資料集,該演算法是相對可伸縮的和高效率的,因為它的複雜度大約是

o(nkt)

,其中n

是所有物件的數目,

k是簇的數目

,t是迭代的次數。通常

k<。這個演算法通常區域性收斂。

(3)演算法嘗試找出使平方誤差函式值最小的

k個劃分。當簇是密集的、球狀或團狀的,且簇與簇之間區別明顯時,聚類效果較好。

缺點:(1)k-

平均方法只有在簇的平均值被定義的情況下才能使用,且對有些分類屬性的資料不適合。

(2)要求使用者必須事先給出要生成的簇的數目k。

(3)對初值敏感,對於不同的初始值,可能會導致不同的聚類結果。

(4)不適合於發現非凸面形狀的簇,或者大小差別很大的簇。

(5)對於"雜訊

"和孤立點資料敏感,少量的該類資料能夠對平均值產生極大影響。

各種機器學習方法概念

部落格 強化學習 reinforcement learning 所謂強化學習就是智慧型系統從環境到行為對映的學習,以使獎勵訊號 強 化訊號 函式值最大,強化學習不同於連線主義學習中的監督學習,強化學習中由環境提供的強化訊號是對產生動作的好壞作一種評價 通常為標量訊號 而不是告訴強化學習系統rls r...

機器學習方法

根據資料型別的不同,對乙個問題的建模有不同的方式。在機器學習或者人工智慧領域,人們首先會考慮演算法的學習方式。在機器學習領域,有幾種主要的學習方式。將演算法按照學習方式分類是乙個不錯的想法,這樣可以讓人們在建模和演算法選擇的時候考慮能根據輸入資料來選擇最合適的演算法來獲得最好的結果。監督式學習 在監...

常見機器學習演算法優缺點

1 線性模型 形式簡單 易於建模 很好的可解釋性 2 邏輯回歸 無需事先假設資料分布 可得到近似概率 對率函式任意階可導的凸函式,許多數值優化演算法都可直接用於求取最優解 3 線性判別分析 lda 當兩類資料同先驗 滿足高斯分布且協方差相等時,lda可達到最優分類 4 boosting 代表adab...