一、業務理解
主要任務是深刻理解業務需求,在此基礎上制定資料探勘的目標和實現目標的初步計畫。
二、資料理解
收集資料,熟悉資料,識別資料的質量問題和探索引起興趣的子集。
三、資料準備
從收集來的資料集選擇必要的屬性(因素),並按關聯關係將它們連線成乙個資料集,然後進行資料清洗:即空值及異常值處理、離群值剔除,資料標準化等。
四、建模階段
選擇應用不同的資料探勘技術,並確定模型最佳的引數。如果初步分析發現模型的效果不太滿意,需要再跳回到資料準備階段,甚至資料理解階段。
五、建模評估
主要對建立的模型進行可靠性評估和合理性解釋。
六、部署階段
根據評估後認定為合理的模型,制定將其應用於實際工作的策略,形成應用部署報告。
資料探勘流程
下面是資料探勘流程 crisp dm 跨行業資料探勘標準流程 這是目前業界主流的 資料探勘流 程,其實本人覺得這也是統計學 建 模方式的語言模式,大家都是這麼做的,只是用個專門的流程會方便一些 1 業務理解 理解專案的目標和從業務的角度理解需求,同時將這個知識轉化為資料探勘問題的定義和完成目標的初步...
資料探勘流程
crisp dm cross industry standard process for data mining 即為 跨行業資料探勘過程標準 此kdd knowledge discovery in database 過程模型於1999年歐盟機構聯合起草.通過近幾年的發展,crisp dm 模型在各...
資料探勘的流程
資料探勘環境 資料探勘是指乙個完整的過程,該過程從大型資料庫中挖掘先前未知的,有效的,可實用的資訊,並使用這些資訊做出決策或豐富知識.資料探勘環境可示意如下圖 7.2資料探勘過程圖 下圖描述了資料探勘的基本過程和主要步驟 資料探勘的基本過程和主要步驟 7.3 資料探勘過程工作量 在資料探勘中被研究的...