1 引言
資料探勘匯集了統計學、人工智慧、資料庫等學科的內容,是一門新興的交叉學科。這門學科旨在幫助人們從海量資料中發現有價值的資訊,目前在商業中的應用剛剛起步。國內日趨激烈的移動通訊市場競爭促使各移動通訊運營商去降低運營成本、提供差異化的客戶服務,而資料探勘技術的應用可以幫助運營商分析客戶消費行為,識別客戶特徵,輔助運營商進行有效的市場營銷和客戶服務。
2 資料探勘技術概述
「資料探勘包含了一系列旨在從資料集中發現有用而尚未發現的模式(pattern)的技術。」[1]。確切地說,資料探勘是一種知識發現的過程,它主要基於統計學、人工智慧、機器學習等技術,高度自動化地分析資料,做出歸納性的推理,從中挖掘出潛在的模式,並對未來情況進行**,以輔助決策者評估風險、做出正確的決策。資料探勘與聯機分析處理(on-line analytical processing, olap)都是分析型工具。聯機分析處理作為驗證型分析工具,「更多地依賴使用者輸入的問題和假設」[2], 使得使用者能夠快速地檢索到所需要的資料,而資料探勘能夠自動地發現隱藏在資料中的模式(pattern)。
在實際應用中,資料探勘主要採用以下幾種方法進行模式的發現:
(1)相關分析和回歸分析:相關分析主要分析變數之間聯絡的密切程度;而回歸分析主要基於觀測資料建立變數之間適當的依賴關係。相關分析是回歸分析的基礎。
(3)分類分析:分類分析首先為每乙個觀測賦予乙個標記,然後檢查這些被標記的觀測,描述出這些觀測的特徵。這種描述可以是乙個數學公式或者模型,利用它可以分類新的觀測。常用的幾種典型的分類模型有線性回歸模型、決策樹模型、基於規則模型和神經網路模型等。
聚類分析:與分類分析不同,聚類分析的輸入是一組未標定的記錄,目的是根據一定的規則,合理地劃分記錄集合。聚類分析和分類分析是一組互逆的過程,因此在很多分類分析中適用的演算法也同樣適用於聚類分析。
3 資料探勘在移動通訊中的應用
(1)各個資訊系統都各自比較完整地管理著客戶某一部分的資訊,眾多的客戶資料、市場營銷資料、帳務資料以不同的資料格式和訪問方式分散在不同的系統中,形成眾多的資訊孤島,在各個資訊孤島中存在著冗餘和不一致,不能滿足資料探勘過程中資料必須具有單一檢視(single view)的要求。
3.1 資料倉儲的建立
資料倉儲作為資料探勘的基礎,不同於傳統的聯機事務處理系統,它具有面向主題的、整合的、不可更新以及隨時間變化的特性。各個聯機事務處理系統作為資料倉儲的原始資料源,以檔案方式提供客戶基本資料、客戶呼叫清單、客戶帳單、客戶聯絡歷史記錄等資料。資料倉儲通過etl過程(抽取、轉換和載入)處理這些介面檔案,並且按不同的主題域組織、儲存和管理這些客戶資料。通過資料倉儲介面,對資料倉儲中的客戶資料進行聯機分析和資料探勘。整個資料倉儲的體系結構見圖1,主要由資料來源、企業級資料倉儲和決策支援三個部分組成。
3.2 資料探勘的主題定義
在建立完成企業級的客戶資訊資料倉儲之後,可以基於這個資料倉儲平台進行資料探勘工作。但在資料探勘工作開展之前,必須明確資料探勘所需要解決的問題和所需要達到的預定目標。也只有在目標明確定義的前提下,資料探勘的工作才有方向和意義。本文針對移動通訊運營商市場運營的特點,定義了以下主題作為資料探勘的目標。
3.2.1 客戶行為分析
利用分類分析法和聚類分析法對客戶通話行為進行分析,從而得出客戶在消費習慣、生活方式、社會聯絡等方面的特徵。對客戶行為分析的根本目的是為了按不同特徵劃分客戶群,針對不同客戶群的特徵,運營商可以進行不同的市場營銷活動和客戶服務。在客戶群劃分中典型的應用就是針對某一客戶群的消費特徵進行某種移動業務的營銷。
3.2.2 優惠策略****
優惠是市場營銷中十分重要的一部分,優惠策略的不恰當,常常會得到適得其反的市場效果。優惠策略****就是通過已建立的客戶行為模型**客戶對優惠策略的反應,從而**優惠策略實施的效果。通過對優惠策略的**,可以**優惠策略的成功與否,從而進行相應的調整和優化。
3.2.3 客戶忠誠度分析
客戶忠誠度分析主要通過對客戶消費金額和帳務支付的分析建立客戶價值模型,從而獲得客戶價值和離網傾向。客戶是運營商價值之所在,通過對客戶忠誠度分析,有針對性的對**值客戶進行優質服務,對有離網傾向的客戶及時進行挽留活動對提高運營商市場占有率,降低營銷成本是十分有用的。
3.2.4 反欺詐分析
目前,移動運營商面臨的乙個最嚴重的問題是欠費問題,其中很大一部分是欺詐消費,因此反欺詐消費已經成為移動通訊發展的關鍵。通過對客戶資料的多維分析、聚類分析和孤立點分析可以建立客戶欺詐消費模型,從而可以有效的對客戶消費行為進行監控,對滿足欺詐消費模型的消費行為進行告警。
3.2.5 競爭對手分析
成熟的市場必然是乙個競爭比較充分的市場。不同運營商客戶之間的互聯互通是最基本的前提,因此通過對客戶與競爭對手客戶之間通話的行為分析,可以建立有關競爭對手經營和客戶服務的模型,比如競爭對手客戶發展模型,通過對這些模型的使用,可以制定有效的市場應對策略。
3.3 資料探勘的過程
在資料探勘目標明確的前提下,可以基於已經建成的企業級客戶資訊資料倉儲進行資料探勘工作。本文將遵循以下步驟:問題定義、資料準備、資料探索、建立模型、模型檢驗、模型應用以及投資回報分析,其中問題定義已經在上文主題定義部分完成。
在問題定義之後,需要建立乙個資料集市作為資料探勘和分析的物件,一般抽取資料倉儲中與問題相關的資料子集作為資料集市。在建立集市過程中可以使用隨機抽樣、等距抽樣、分層抽樣和分類抽樣等抽樣技術來減少資料集市的資料量;通過對資料的刪選和對小概率事件的放大,使得資料集市中資料的特徵和規律性更加顯著。
在資料探索過程中,通過多維分析和視覺化展現探索資料的特徵,通過對資料進行增刪操作或者根據現有變數重新組合生成一些新的變數來更加有效的描述資料特徵;其中,對資料統計特性的分析在資料探索過程中起著十分重要的作用。建立數學模型是資料探勘工作的核心環節,目前比較常用的建模方法有神經元網路模型、決策樹模型和回歸模型。資料探勘中具體使用哪一種方法,取決於資料集市的特徵和需要實現的目標,在實際應用中,往往是對多種建模方法的比較和綜合。在建模過程中,把資料分層為訓練資料和校驗資料,訓練資料主要使用於建模過程中求解模型引數,而校驗資料主要用於模型檢驗。因此模型檢驗階段的主要工作是把檢驗資料代入已經建立的模型中,觀察模型的響應,通過比較模型的響應和真實的資料,從而評估模型的準確程度。如果模型的準確性比較差,就需要重新進行資料探索、建立新的模型、直至新模型檢驗。因此,在實際應用中,資料探索、建立模型、模型檢驗是反覆迭代的過程,見圖2。
資料探勘的過程就是乙個不斷探索資料特徵、建立和檢驗模型,發現客戶消費行為特徵的過程;移動運營商只有把模型的結果應用到市場營銷和客戶服務過程中,才能真正發揮資料探勘的作用。
4 結論
移動通訊市場的激烈競爭導致了面向市場營銷和客戶服務的資料倉儲的建設以及資料探勘技術的應用,本文在介紹了資料探勘技術的基礎上,重點闡述了移動通訊運營商資料探勘平台的建立,以及基於這個平台展開資料探勘的過程和資料探勘的主題分析。應該說,運營商對各種技術應用的最終目的是實施以客戶服務為中心的客戶關係管理(customers relation management, crm),但在目前情況下,本文認為,移動運營商當務之急是在建立資料倉儲的基礎上成功實施多主題的資料探勘。
資料探勘技術在移動通訊中的應用
1 引言 資料探勘匯集了統計學 人工智慧 資料庫等學科的內容,是一門新興的交叉學科。這門學科旨在幫助人們從海量資料中發現有價值的資訊,目前在商業中的應用剛剛起步。國內日趨激烈的移動通訊市場競爭促使各移動通訊運營商去降低運營成本 提供差異化的客戶服務,而資料探勘技術的應用可以幫助運營商分析客戶消費行為...
DSP在通訊中的應用
在當前的dsp市場上,通訊裝置是其最大的使用者,以下是其中的幾個例子 1 數字式蜂房系統 數字式蜂房系統使用通用dsp來實現語音合成 speech synthesis 糾錯編碼 error correction coding 基帶數據機 baseband modem 以及系統控制等功能。a.語音合成...
通訊中的「交織」技術
在陸地移動通訊這種變參通道上,位元差錯經常是成串發生的。這是由於持續較長的深衰落谷點會影響到相繼一串的位元。然而,通道編碼僅在檢測和校正單個差錯和不太長的差錯串時才有效。為了解決這一問題,希望能找到把一條訊息中的相繼位元分散開的方法,即一條訊息中的相繼位元以非相繼方式被傳送。這樣,在傳輸過程中即使發...