資料探勘領域十大經典演算法

2021-08-03 00:21:12 字數 639 閱讀 4460

2023年,wu xindong 出版的一本書名叫:the top ten algorithms in data mining,裡面有關於演算法的介紹

一、c4.5,分類決策樹演算法

二、the k-means algorithm 即k-means演算法,聚類演算法

三、 support vector machines  支援向量機,廣泛的應用於統計分類以及回歸分析中

四、the apriori algorithm  挖掘布林關聯規則頻繁項集的演算法

五、最大期望(em)演算法,在概率

(probabilistic)模型中尋找引數最大似然估計的演算法

六、 pagerank,根據**的外部鏈結和內部鏈結的數量和質量,衡量**的價值

七、adaboost,針對同乙個訓練集訓練不同的分類器(弱分類器),然後把這些弱分類器集合起來,構成乙個更強的最終分類器 (強分類器)

八、 knn: k-nearest neighbor classification,分類演算法

九、 ***** bayes,在眾多的分類模型中,應用最為廣泛的兩種分類模型是決策樹模型(decision tree model)和

樸素貝葉斯模型

十、cart: 分類與回歸樹

資料來源**:

資料探勘十大經典演算法

最近想看看資料探勘是個什麼東西,因此特別的關注了下,首先看看資料探勘包含哪些演算法,網上找到了十大經典演算法 01.c4.5 是機器學習演算法中的一種分類決策樹演算法,其核心演算法是 id3演算法 02.k means演算法 是一種聚類演算法。03.svm 一種 監督式學習 的方法,廣泛運用於統計分...

資料探勘十大經典演算法

1 c4.5 2 k means 3 svm 4 apriori 5 em 6 pagerank 7 adaboost 8 knn 9 bayes 10 cart 1 c4.5 計算增益率 step1 計算資料集d的熵 單位為位元 info d step2 計算每個屬性的熵info x d step...

十大經典資料探勘演算法

c4.5演算法 機器學習演算法中的乙個分類決策樹演算法 cart 分類與回歸樹 c4.5與cart都是決策樹演算法 id3用資訊增益,c4.5用資訊增益率,cart用gini係數 knn 樸素貝葉斯 bayes 在眾多的分類模型中,應用最為廣泛的兩種分類模型是決策樹模型 decision tree ...