本文介紹資料探勘的基本流程
針對具體的資料探勘應用的需求,首先需要明確本次的挖掘目標是什麼,系統完成後能達到什麼樣的效果,因此,我們要分析應用領域中的各種知識,了解相關領域的情況,弄清楚使用者的需求。必須明確的認識我們要幹什麼,再決定怎麼做。
明確資料探勘目標後,需要抽取與挖掘目標相關的樣本資料子集。抽取資料的標準為:相關性、可靠性、有效性。即一定要重視資料的質量,抽取資料後先應先檢察其資料質量如何。衡量資料質量的標準有:資料完整無缺,各項指標項齊全;資料準確無誤,反映的是正常狀態下的水平。
同過異常值分析、缺失值分析、相關分析、週期分析等對資料進行進一步探索、審核和必要的加工處理,保證資料的質量、使其更好服務於後期的挖掘建模。
通過降為處理、缺失值處理等對有問題的資料進行處理
《資料探勘》基礎
資料探勘 data mining 是發現資料中有用模式的過程,目的在於使用所發現的模式幫助解釋當前的行為或 未來的結果 資料探勘過程涉及幾個方面 1 資料收集和儲存 2 資料選取與準備 3 模型建立與檢驗 4 解釋與驗證結果 5 模型應用 資料探勘是乙個處理過程,它利用一種或多種計算機學習技術,從資...
資料探勘基礎
什麼是資料探勘?從大量資料 包括文字 中挖掘出隱含的 未知的 對決策有潛在價值的關係 模式和趨勢,並運用這些知識和規則建立用於決策支援的模型,提供 性決策支援的方法 工具和過程,就是資料探勘。常用的資料探勘建模工具 資料探勘的基本任務包括利用分類與 聚類分析 關聯規則 偏差檢測 智慧型推薦等方 法,...
資料探勘入門系列 資料探勘基礎
伴隨著資訊化系統建設的發展,各行各業的中大型企業都儲存了大量的業務資料。很多的企業想要通過對這些資料的分析,來發現新的商機以及從這些資料中找到提高盈利的方法。大部分的企業,都是憑藉管理人員的自身個人經驗來開展這項工作。如果有一套系統,能夠自動地或者半自動地發現相關的知識和解決方案,這樣將會有效地提高...