資料探勘流程

2021-08-20 18:43:40 字數 395 閱讀 2961

一、業務理解

主要任務是深刻理解業務需求,在此基礎上制定資料探勘的目標和實現目標的初步計畫。

二、資料理解

收集資料,熟悉資料,識別資料的質量問題和探索引起興趣的子集。

三、資料準備

從收集來的資料集選擇必要的屬性(因素),並按關聯關係將它們連線成乙個資料集,然後進行資料清洗:即空值及異常值處理、離群值剔除,資料標準化等。

四、建模階段

選擇應用不同的資料探勘技術,並確定模型最佳的引數。如果初步分析發現模型的效果不太滿意,需要再跳回到資料準備階段,甚至資料理解階段。

五、建模評估

主要對建立的模型進行可靠性評估和合理性解釋。

六、部署階段

根據評估後認定為合理的模型,制定將其應用於實際工作的策略,形成應用部署報告。

資料探勘流程

下面是資料探勘流程 crisp dm 跨行業資料探勘標準流程 這是目前業界主流的 資料探勘流 程,其實本人覺得這也是統計學 建 模方式的語言模式,大家都是這麼做的,只是用個專門的流程會方便一些 1 業務理解 理解專案的目標和從業務的角度理解需求,同時將這個知識轉化為資料探勘問題的定義和完成目標的初步...

資料探勘流程

crisp dm cross industry standard process for data mining 即為 跨行業資料探勘過程標準 此kdd knowledge discovery in database 過程模型於1999年歐盟機構聯合起草.通過近幾年的發展,crisp dm 模型在各...

資料探勘的流程

資料探勘環境 資料探勘是指乙個完整的過程,該過程從大型資料庫中挖掘先前未知的,有效的,可實用的資訊,並使用這些資訊做出決策或豐富知識.資料探勘環境可示意如下圖 7.2資料探勘過程圖 下圖描述了資料探勘的基本過程和主要步驟 資料探勘的基本過程和主要步驟 7.3 資料探勘過程工作量 在資料探勘中被研究的...