業務背景:電信業,銀行,電商,智慧型產品等
思維框架:商業理解 → 資料理解 → 資料準備 → 建立模型 → 模型評估 → 模型應用
商業智慧型是通過對來自不同的資料來源進行統一處理及管理,通過靈活的展現方式來幫助企業進行決策支援
即:資料 → 資訊 → 知識 → 決策
crisp-dm:跨行業資料探勘標準流程
基本應用過程
1,提出乙個業務問題
2,結合三方面的資源進行資料探勘(資料,業務知識,資料探勘軟體)
3,獲取有業務價值的知識或規律
4,將業務知識或規律嵌入到業務流程中,實現業務目標
crisp-dm六個步驟
商業理解
確定商業目標(背景,目標,成功標準)
目標評估
a. 資源需求,假設和約束
b. 風險和應急方案
c. 成本和收益
確定資料探勘目標
專案實施計畫
資料理解
資料的初步採集
資料描述
資料探索性分析
驗證資料質量
資料準備
選擇資料
資料報含/剔除的邏輯和標準
清洗資料
構建資料
新的字段(衍生變數),新的紀錄
合併資料
格式化資料
建立模型
選擇建模技術
生成檢驗設計
建立模型
模型的引數設定,模型的描述
評價模型
模型評估
評估結果
從商業成功標準的角度進行結果評估
過程回顧
對資料探勘過程進行回顧,查詢疏忽和遺漏
確定下一步的工作內容
結果發布
規劃部署方案
規劃監控和維護方案
生成最終報告
專案回顧總結
是指在全球資訊網和網際網路上充分利用人工智慧和高階資訊科技,web智慧型的目標是ai和it在新的web平台上的聯合目標,即將ai和it應用到基於web智慧型資訊系統的設計和實現上。
包含:web內容挖掘,web結構挖掘,web使用挖掘
web內容挖掘
從文字資料中挖掘知識,涵蓋課題:
文字分類:監督的學習方法
文字聚類:無監督的方法
資訊抽取:從半結構化資料或自由文字中抽取結構化資料
web結構挖掘
根據文字資料中附帶的鏈結資訊發現知識
輸入:文件中鏈結列表
輸出:文件的重要性度量(中心性和權威性)的數值
中心性:文件d指向的權威文件越多,d中心性越強
權威性:指向文件d的中心文件越多,d權威性越強
重要方法:pagerank演算法(google)
讓智慧型與商業聯姻
很多企業的業務經理成天都被一堆毫無關聯的資料折磨。雖然公司可以使用 bi business intelligence,商業智慧型 和績效管理系統來收集資料,但這些系統無法保證他們及時獲取到支撐每日決策所需的相關可靠資料。由於業務經理對收集到的資料缺乏信心,或是由於難度較大無法獲得所需資料,他們經常無...
BI 商業智慧型與 BA 商業分析 的區別
企業it部門經常聽到的兩個詞彙是business analysis 商業分析,business intelligence 商業智慧型。很多人將兩者混為一談,特別是很多hr公司在招聘職位時也將這兩者混淆。下面我就簡單介紹一下兩者的區別。bi business intelligence 商業智慧型的定義...
商業智慧型與視覺化報告開源軟體
收集備用 1.jaspersoft 2.pentaho提供了一款免費的包括業務分析以及資料整合 報表設計器和市場開發外掛程式,以及幫助pentaho社群擴充套件功能的平台的社群版的業務分析套件。3.spagobi是100 開源的商業智慧型套件。它的這種模組結構,是基於可以很容易的自定義開放標準,並且...