最近想看看資料探勘是個什麼東西,因此特別的關注了下,首先看看資料探勘包含哪些演算法,網上找到了十大經典演算法:
01.c4.5:是機器學習演算法中的一種分類決策樹演算法,其核心演算法是
id3演算法
。02.k-means演算法:是一種聚類演算法。
03.svm:一種
監督式學習
的方法,廣泛運用於統計分類以及回歸分析中
04.apriori :是一種最有影響的挖掘布林關聯規則
頻繁項集
的演算法。
05.em:最大
期望值法
。06.pagerank:是google演算法的重要內容。
07.adaboost:是一種迭代演算法,其核心思想是針對同乙個訓練集訓練不同的分類器然後把弱分類器集合起來,構成乙個更強的最終分類器。
08.knn:是乙個理論上比較成熟的的方法,也是最簡單的機器學習方法之一。
09.***** bayes:在眾多分類方法中,應用最廣泛的有決策樹模型和樸素貝葉斯(***** bayes)
10.cart:分類與回歸樹,在分類樹下面有兩個關鍵的思想,第乙個是關於遞迴地劃分自變數空間的想法,第二個是用驗證資料進行減枝。
看完發現這不就是模式識別的常用演算法嗎,看來哥也可以轉行做資料探勘了!
資料探勘十大經典演算法
1 c4.5 2 k means 3 svm 4 apriori 5 em 6 pagerank 7 adaboost 8 knn 9 bayes 10 cart 1 c4.5 計算增益率 step1 計算資料集d的熵 單位為位元 info d step2 計算每個屬性的熵info x d step...
十大經典資料探勘演算法
c4.5演算法 機器學習演算法中的乙個分類決策樹演算法 cart 分類與回歸樹 c4.5與cart都是決策樹演算法 id3用資訊增益,c4.5用資訊增益率,cart用gini係數 knn 樸素貝葉斯 bayes 在眾多的分類模型中,應用最為廣泛的兩種分類模型是決策樹模型 decision tree ...
資料探勘領域十大經典演算法
2009年,wu xindong 出版的一本書名叫 the top ten algorithms in data mining,裡面有關於演算法的介紹 一 c4.5,分類決策樹演算法 二 the k means algorithm 即k means演算法,聚類演算法 三 support vector...