資料探勘怎麼做

2022-09-22 06:42:13 字數 586 閱讀 9027

理解你的資料探勘要解決什麼業務問題

必須從商業或者從業者的角度去了解專案的要求和最終目的,去分析整個問題涉及的資源、侷限、設想,甚至是風險、意外等情況,從業務來到業務中去

重點:在業務理解的基礎上,對掌握的資料要有乙個清晰明確的認識(了解有哪些資料,那些可能對目標有影響的資料,哪些是冗餘資料、哪些是存在不足或者缺失)

注意:資料理解和業務理解相輔相成

比如財務裡面銷售資料、採購資料、收入支出資料

資料準備是基於原始資料,去構建資料探勘模型所需要的資料集的所有工作,包括資料收集、資料清洗、資料補全、資料整合、資料轉換、特徵提取等一系列動作

或者是訓練模型,重點解決技術方面的問題

選用各種各樣的演算法模型來處理資料,讓模型學習資料的規律,並產出模型

如果有多重技術要使用,在這一任務中,對於每乙個要使用的技術要分別對待

比如svm演算法只能輸入數值型的資料

模型的效果如何,能否滿足業務的需求

需要使用各種評估手段、評估指標甚至是讓業務人員一起參與進來,徹底地評估模型

解決一些實際問題

比如長期執行的模型是否有足夠的機器來支撐,資料量以及併發程度會不會造成部署的服務出現問題

資料探勘怎麼做關聯性分析呢?

接下來我們以購物籃這個典型的應用來為大家介紹,在購物場景下,是如何做關聯分析,並幫助購物者更快速買到自己想要的東西。全文講解中所用到的產品是由億信華辰提供的資料探勘平台豌豆dm。整個過程分為以下幾個步驟 應用目標 從訂單資料集中找出關聯度較高的商品。下圖的資料集為某 的訂單資料集 1000條訂單號,...

大資料時代的資料探勘是怎麼做的?

一 資料探勘在大資料時代,資料的產生和收集是基礎,資料探勘是關鍵,資料探勘可以說是大資料最關鍵也是最基本的工作。通常而言,資料探勘也稱為datamining,或知識發現knowledge discovery from data,泛指從大量資料中挖掘出隱含的 先前未知但潛在的有用資訊和模式的乙個工程化...

資料恢復該怎麼做

資料恢復對於大部分人都是乙個陌生的詞,一但接觸資料恢復就意味著有重要的資料丟失,不得不做資料恢復.但是資料丟失後要該怎麼做,相信很多人沒有清晰的認識.下面我來為大家分析幾種常見的資料丟失後應該如何做.1 檔案誤刪除 誤刪檔案後,檔案所在的盤不能存入任何新的檔案。不管是先刪除到 站還是直接安裝 f鍵永...