資料探勘的目的是什麼?看這個銀行客戶流失案例就知道

2021-10-11 19:16:34 字數 1774 閱讀 8756

很多人估計還不清楚資料探勘的目的是什麼,其實資料探勘的兩大目的就是是**和描述資料,其中前者的計算機建模及實現過程通常被稱為監督學習(supervised learning) ,後者的則通常被稱為無監督學習(supervised learning) 。往更細分,資料探勘的目標可以劃分為以下這些:

**資料

**性挖掘任務對當前資料進行推斷,以做出**。**主要包括分類——將樣本劃分到幾個預定義類之一;回歸——將樣本對映到乙個真實值**變數上。也就是說給了一定的目標屬性,讓去**目標的另外一特定屬性。如果該屬性是離散的,通常稱之為「分類」,而如果目標屬性是乙個連續的值,則稱之為「回歸」。

描述資料

描述性挖掘任務是描述資料庫中資料的一般性質。描述主要包括聚類——將樣本劃分為不同類(無預定義類),關聯規則發現——發現資料集中不同特徵的相關性。這是指找出資料間潛在的聯絡模式。其他的描述任務還有異常檢測,其過程類似於聚類的反過程,聚類將相似的資料聚合在一起,而異常檢測將離群太遠的點給剔除出來。

說起來可能很複雜,不容易理解,為了幫助大家了解資料探勘是如何進行的,如何對**性挖掘任務對當前資料進行推斷,以做出**。我引用smartbi的資料探勘平台(smartbi mining)快速搭建乙個銀行客戶流失的**的過程。

1.新建實驗

smartbi資料探勘的預設介面為『實驗管理』介面,該介面可以進行『新建實驗』:

新建方式1:在資料夾右鍵選單『新建』中單擊『實驗』;

新建方式2:單擊『新建實驗』。

2.選擇資料來源

根據原始資料存放的方式在選擇資料來源節點,將資料來源節點拖拽至畫布區域,並在引數面板上進行資料來源資訊的設定。

3.資料模型搭建

特徵選擇:將『卡等級』、『是否為代發客戶』、『月均代發金額』、『最多代發金額』、『月初aum』、『月均aum』做為特徵列,而『是否流失』做為標籤列;

拆分:將資料集進行拆分,一部分資料用來訓練模型,另一部分用來驗證經過訓練的模型效果如何;

隨機森林:本研究用分類演算法節點中選擇 隨機森林演算法 進行**客戶流失的模型構建。

4.訓練&**

訓練:訓練節點的輸入分為兩部分,左邊為演算法節點,右邊為訓練資料集,模型通過對訓練集資料中特徵列的資料進行學習,並根據標籤列的資料,確認具有何種特徵的資料可能是流失客戶,進而使模型獲得能夠識別流失客戶的能力;

**:**節點的輸入分為兩部分,左邊為訓練好的模型,右邊為測試資料集,模型運用識別流失客戶的能力,對測試集中的特徵列資料進行處理,並獲得是否為流失客戶的標記,這裡的標記是資料模型給出的結論,並非測試集中標籤列的資料。

5.結果評估

評估:通過對比資料模型**結果與測試集資料之間的差異,可以評價模型的效果。

最終輸出評價結果為:

圖:smartbi銀行客戶流失**結果

資料分析和資料探勘的區別是什麼?

就目前而言,大資料 資料分析 物聯網 人工智慧的不斷發展使得各行各業積累了很多的原始資料,尤其是在這個網際網路時代中,資料不斷的擴大。對於資料的正誤以及是夠有價值都是比較重要的,於是就有了資料分析這個行業,但是資料行業的新人對於資料分析和資料探勘不是很清楚多了,那麼現在就給大家講講資料分析和資料探勘...

銀行的動態口令令牌是什麼原理

有網銀的少年們一般都收到過銀行給的這樣乙個令牌,俗稱動態口令,在支付的時候輸入自己的密碼和動態口令上的動態密碼,就能完成驗證,銀行就相信你不是壞人了,今天我們來簡述一下這個動態口令令牌是個什麼原理。如圖的rsa securid sid700是當前市面上流行使用的動態口令令牌,在筆者準備資料的過程中發...

辦公平台主要的目的是什麼?

開始工作也差不多四年了,有幸參與了國內乙個大型金融公司辦公平台的開發和建設工作,在工作中遇到了很多問題,也積累了少許算不上經驗的經驗,來到這裡來分享一下,和大家 一下,有好的地方大家可以借鑑,不好的地方呢也請大家指教,也能對我的工作進行改進。說起辦公平台的開發,可能很多的技術人都嗤之以鼻,覺得技術含...