資料探勘方法

2021-05-28 09:45:35 字數 508 閱讀 5608

資料探勘方法

分類決策樹

id3演算法

c4.5演算法

c5.0演算法

cart演算法

支援向量機

聚類k-means演算法

twostep演算法

關聯規則

apriori演算法

fp-tree演算法

carma演算法

序列模式演算法

篩選特徵選擇演算法

異常檢測演算法

回歸分析

線性回歸

邏輯回歸

神經網路

多層感知器網路

rbf網路

kohonen網路

時間序列

指數平滑

arima模型

分類的過程

獲取資料-》預處理-》設計分類器-》分類決策

id3演算法是quinlan於2023年提出來的,只能處理離散型描述屬性。思想是選擇資訊增益最大的屬性劃分訓練集樣本,目的是在進行分枝時系統的熵最小,從而提高演算法的運算速度和精確度。

資料探勘方法比較

一 可解釋性和應用廣泛性 1 決策樹 簡單直觀,邏輯性強,易於理解和應用,廣泛使用。2 神經網路 可解釋性差,遠沒有決策樹和回歸應用廣泛。3 logistic回歸 更為成熟 應用更為廣泛,具有強大的活力和最廣泛的業務應用基礎。二 缺失值和異常值敏感情況 1 決策樹 對缺失值幾乎不做處理即可應用,不易...

資料探勘常用方法

原文出自 1 分類。分類是找出資料庫中的一組資料物件的共同特點並按照分類模式將其劃分為不同的類,其目的是通過分類模型,將資料庫中的資料項對映到摸個給定的類別中。可以應用到涉及到應用分類 趨勢 中,如 商鋪將使用者在一段時間內的購買情況劃分成不同的類,根據情況向使用者推薦關聯類的商品,從而增加商鋪的銷...

資料探勘方法彙總

資料探勘的任務是從資料中發現模式。模式按功能分為 型 predictive 和描述型 descriptive 而按實際作用可分為以下6種 1 分類模式分類模式把資料集中的資料項對映到某個給定的類上,如決策樹方法 統計方法及粗糙集方法等。2 回歸模式分類模式的 值是離散的,回歸模式的 值是連續的。3 ...