資料探勘的步驟:需求->資料抓取->特徵選擇->模型選擇->驗證->應用
雖然步驟是靈活的,但是筆面試還是以這樣的過程為基準的
分析步驟:首先要做技術評估
1, 資料抽取統計分析:對於資料特徵有乙個初步的把握
2, 資料清洗
3, 資料變換
4, 歸併和分類
5, 屬性選擇
6, 模型構建:如果採用低有效的演算法,可以採用整合學習的方法來進行學習,得到乙個評分的排名結果
7, 模型評價:採用幾種評價手段來進行分析:使用者召回率,人工分析,誤差分析,分類準確度分析,矩陣分析,28原則等
8, 結果分析:對演算法的優缺點逐一分析,看有沒有提公升的方法
需要了解的情況:
資料特徵
資料特性
從業務人員角度考慮得到的關鍵特徵
從運營方角度考慮的得到的關鍵特徵
固有模型
需要交付的檔案:
模型及使用文件
發現的一般規律
常見錯誤及解決方案
模型思路及今後可能的優化方向
常見的機器學習 資料探勘知識點
or odds ratio,優勢率 n gram model lsa latent semantic analysis,潛在語義分析 plsa probabilistic latent semantic analysis,基於概率的潛在語義分析 lda latent dirichlet alloca...
常見的機器學習 資料探勘知識點
nb bayesian,樸素貝葉斯 bn bayesian network bayesian belief network belief network 貝葉斯網路 貝葉斯信度網路 信念網路 lda linear discriminant analysis fisher linear discrim...
資料儲存知識點總結
1.什麼是謂詞?答案 謂詞是通過nspredicate,是通過給定的邏輯條件作為約束條件,完成對資料的篩選。predicate nspredicate predicatewithformat customerid d n a customers filteredarrayusingpredicate...