機器學習演算法的優點和缺點總結
1.正則化演算法(regularization algorithms)
它是另一種方法(通常是回歸方法)的拓展,這種方法會基於模型複雜性對其進行懲罰,它喜歡相對簡單能夠更好的泛化的模型。
例子:
優點:
缺點:
2.整合演算法(ensemble algorithms)
整合方法是由多個較弱的模型整合模型組,其中的模型可以單獨進行訓練,並且它們的**能以某種方式結合起來去做出乙個總體**。
該演算法主要的問題是要找出哪些較弱的模型可以結合起來,以及結合的方法。這是乙個非常強大的技術集,因此廣受歡迎。
優點:
缺點:
3.決策樹演算法(decision tree algorithm)
決策樹學習使用乙個決策樹作為乙個**模型,它將對乙個 item(表徵在分支上)觀察所得對映成關於該 item 的目標值的結論(表徵在葉子中)。
樹模型中的目標是可變的,可以採一組有限值,被稱為分類樹;在這些樹結構中,葉子表示類標籤,分支表示表徵這些類標籤的連線的特徵。
例子:
優點:
缺點:
4.回歸(regression)演算法
回歸是用於估計兩種變數之間關係的統計過程。當用於分析因變數和乙個多個自變數之間的關係時,該演算法能提供很多建模和分析多個變數的技巧。具體一點說,回歸分析可以幫助我們理解當任意乙個自變數變化,另乙個自變數不變時,因變數變化的典型值。最常見的是,回歸分析能在給定自變數的條件下估計出因變數的條件期望。
回歸演算法是統計學中的主要演算法,它已被納入統計機器學習。
例子:
優點:
缺點:
5.人工神經網路
人工神經網路是受生物神經網路啟發而構建的演算法模型。
它是一種模式匹配,常被用於回歸和分類問題,但擁有龐大的子域,由數百種演算法和各類問題的變體組成。
例子:
優點:
缺點:
6.深度學習(deep learning)
深度學習是人工神經網路的最新分支,它受益於當代硬體的快速發展。
眾多研究者目前的方向主要集中於構建更大、更複雜的神經網路,目前有許多方法正在聚焦半監督學習問題,其中用於訓練的大資料集只包含很少的標記。
例子:
優點/缺點:見神經網路
7.支援向量機(support vector machines)
給定一組訓練事例,其中每個事例都屬於兩個類別中的乙個,支援向量機(svm)訓練演算法可以在被輸入新的事例後將其分類到兩個類別中的乙個,使自身成為非概率二進位制線性分類器。
svm 模型將訓練事例表示為空間中的點,它們被對映到一幅圖中,由一條明確的、盡可能寬的間隔分開以區分兩個類別。
隨後,新的示例會被對映到同一空間中,並基於它們落在間隔的哪一側來**它屬於的類別。
優點:
缺點:
8.降維演算法(dimensionality reduction algorithms)
和集簇方法類似,降維追求並利用資料的內在結構,目的在於使用較少的資訊總結或描述資料。
這一演算法可用於視覺化高維資料或簡化接下來可用於監督學習中的資料。許多這樣的方法可針對分類和回歸的使用進行調整。
例子:
優點:
缺點:
9.聚類演算法(clustering algorithms)
聚類演算法是指對一組目標進行分類,屬於同一組(亦即乙個類,cluster)的目標被劃分在一組中,與其他組目標相比,同一組目標更加彼此相似(在某種意義上)。
例子:
優點:
缺點:
10.基於例項的演算法(instance-based algorithms)
基於例項的演算法(有時也稱為基於記憶的學習)是這樣學
習演算法,不是明確歸納,而是將新的問題例子與訓練過程中見過的例子進行對比,這些見過的例子就在儲存器中。
之所以叫基於例項的演算法是因為它直接從訓練例項中建構出假設。這意味,假設的複雜度能隨著資料的增長而變化:最糟的情況是,假設是乙個訓練專案列表,分類乙個單獨新例項計算複雜度為 o(n)
例子:
優點:
缺點:
11.貝葉斯演算法(bayesian algorithms)
貝葉斯方法是指明確應用了貝葉斯定理來解決如分類和回歸等問題的方法。
例子:
優點:
缺點:
12.關聯規則學習演算法(association rule learning algorithms)
關聯規則學習方法能夠提取出對資料中的變數之間的關係的最佳解釋。比如說一家超市的銷售資料中存在規則 => ,那說明當一位客戶同時購買了洋蔥和土豆的時候,他很有可能還會購買漢堡肉。
例子:
13.圖模型(graphical models)
圖模型或概率圖模型(pgm/probabilistic graphical model)是一種概率模型,乙個圖(graph)可以通過其表示隨機變數之間的條件依賴結構(conditional
dependence structure)。
例子:
優點:
缺點:
確定其依賴的拓撲很困難,有時候也很模糊
oracle rac 的優點和缺點
oracle rac 是oracle公司 推出的 資料庫 集群方案。oracle rac 是共享儲存的集群方案。優點 一 多機並行 oracle rac 支援多台伺服器共同對外提供完全相同的資料庫服務。二 高可用性 集群最大的優勢在於它的高可用性,通過使用oracle rac可以在一定程度上避免因為...
索引的優點和缺點
索引的優點 1 索引能夠提高資料檢索的效率,降低資料庫的io成本。2 索引還有乙個非常重要的用途,就是降低資料的排序成本。每個索引中的索引資料都是按照索引鍵值進行排序後存放的,所以,當我們的query語句中包含排序分組操作的時候,如果我們的排序欄位和索引字段剛好一致,mysql query opti...
Ajax的優點和缺點
優點 1 最大的優點就是頁面無重新整理,使用者的體驗非常好 2 使用非同步方式與伺服器通訊,具有更加迅速的相應能力 3 可以把以前的一些伺服器負擔的工作轉嫁到客戶端,利用客戶端限制的能力來處理,減輕伺服器和頻寬的負擔,節約空間和頻寬租用成本,並且減輕伺服器的負擔,ajax的原則是 按需取資料 可以最...