資料探勘新手常問的乙個問題是,這麼多演算法裡面該選用哪乙個?在沒有更多背景資訊給出時,如果追求**的準確程度,一般用支援向量機(svm),如果要求模型可以解釋,一般用決策樹。使用svm的時候選擇高斯核(即rbf kernel),同時要用交叉驗證(cross validation)選擇合適的模型引數。
下面的**是對常用分類演算法的乙個比較,來自一篇文章
kotsiantis, s. b.
supervised machine learning: a review of classification techniques
informatica, 2007
, 31, 249-268
接下來這個**的結論類似,它來自經典名著
hastie, t.; tibshirani, r. & friedman, j.
the elements of statistical learning, second edition
springer, 2009
caruana, r. & niculescu-mizil, a.
an empirical comparison of supervised learning algorithms
proceedings of the 23rd international conference on machine learning, 2006, 161-168
資料探勘演算法的分類
演算法是資料探勘模型建立的核心,由於資料探勘是乙個交叉學科,因此其演算法也集大成於一身,豐富多彩。可根據演算法分析資料的方式 演算法來自的學科 演算法所得結果的型別 學習過程的型別等,對資料探勘的演算法進行分類。一方面,資料探勘能夠通過olap分析和統計分析,實現對資料的多維度彙總,驗證人們實現對資...
資料探勘分類演算法(2)
精品導航 http www.nitaomei.com 1 資料探勘概述 隨著資料庫技術的迅速發展,資料存量大量增加著,但是挖掘海量資料的背後隱藏著的知識的手段遠遠不足。從而導致了 資料 但知識貧乏 的現象。計算機技術的另一領域人工智慧 artificial intelligence 自1956 年誕...
資料探勘之分類演算法
分類是資料探勘 機器學習和模式識別中乙個重要的研究領域。單一的分類方法主要包括 決策樹 貝葉斯 人工神經網路 k 近鄰 支援向量機和基於關聯規則的分類等 還有用於單一分類方法的整合學習演算法,如bagging和boosting等。1 決策樹 主要用於分類和 的技術之一,是以例項為基礎的歸納學習演算法...