資料探勘方法
分類決策樹
id3演算法
c4.5演算法
c5.0演算法
cart演算法
支援向量機
聚類k-means演算法
twostep演算法
關聯規則
apriori演算法
fp-tree演算法
carma演算法
序列模式演算法
篩選特徵選擇演算法
異常檢測演算法
回歸分析
線性回歸
邏輯回歸
神經網路
多層感知器網路
rbf網路
kohonen網路
時間序列
指數平滑
arima模型
分類的過程
獲取資料-》預處理-》設計分類器-》分類決策
id3演算法是quinlan於2023年提出來的,只能處理離散型描述屬性。思想是選擇資訊增益最大的屬性劃分訓練集樣本,目的是在進行分枝時系統的熵最小,從而提高演算法的運算速度和精確度。
資料探勘方法比較
一 可解釋性和應用廣泛性 1 決策樹 簡單直觀,邏輯性強,易於理解和應用,廣泛使用。2 神經網路 可解釋性差,遠沒有決策樹和回歸應用廣泛。3 logistic回歸 更為成熟 應用更為廣泛,具有強大的活力和最廣泛的業務應用基礎。二 缺失值和異常值敏感情況 1 決策樹 對缺失值幾乎不做處理即可應用,不易...
資料探勘常用方法
原文出自 1 分類。分類是找出資料庫中的一組資料物件的共同特點並按照分類模式將其劃分為不同的類,其目的是通過分類模型,將資料庫中的資料項對映到摸個給定的類別中。可以應用到涉及到應用分類 趨勢 中,如 商鋪將使用者在一段時間內的購買情況劃分成不同的類,根據情況向使用者推薦關聯類的商品,從而增加商鋪的銷...
資料探勘方法彙總
資料探勘的任務是從資料中發現模式。模式按功能分為 型 predictive 和描述型 descriptive 而按實際作用可分為以下6種 1 分類模式分類模式把資料集中的資料項對映到某個給定的類上,如決策樹方法 統計方法及粗糙集方法等。2 回歸模式分類模式的 值是離散的,回歸模式的 值是連續的。3 ...