1.資料探勘概念筆記——引論
感覺不錯,讀之並記之。
章節也是按照書中章節來,此處只是筆記,記錄一些重要的概念和核心的思想。
為什麼要進行資料探勘?
答:需要是發明之母——柏拉圖;
資訊時代每天產生的資料海量,不得不需要從中進行挖掘。
資料探勘有什麼用?
答:可以將大型資料集轉化成知識。
此外,資料探勘是資訊科技的進化。
資訊科技從資料收集、資料庫建立、資料管理(包括資料儲存和檢索)到高階資料分析(資料倉儲和資料探勘)前進。
資料探勘技術包括資料清理、資料繼承和聯機分析處理(olap)
什麼是資料探勘?
答:從資料中挖掘知識,也有人把資料探勘視為資料中的知識發現(kdd)
不過知識發現包括以下幾個步驟:
a) 資料清理
b) 資料整合
c) 資料選擇
d) 資料變換
e) 資料探勘
f) 資料評估
g) 知識表示
可以挖掘哪些資料?
答:對於挖掘的應用,最基本形式是資料庫資料、資料倉儲資料和事務資料。
可以挖掘什麼型別的模式?
答:資料探勘功能,包括特徵化與區分,頻繁模式、關聯和相關性挖掘,分類與回歸,聚類分析,離群點分析。資料探勘功能用於指定資料探勘任務發現的模式,一般而言,這些任務可以分為兩個:描述性和**性。
需要什麼技術?
答:統計學、機器學習、模式識別、資料庫和資料倉儲、資訊檢索、視覺化、演算法、高效能計算和許多應用領域的大量技術。
當然每個技術展開都是乙個龐大的分支。但是不是說搞資料探勘就需要懂得所有的技術的。根據需求需要不同的技術。
應用場景?
當前比較成功和流行的應用例子:商務智慧型和搜尋引擎。
商務智慧型技術提供商務運作的歷史、現狀和**檢視。
搜尋引擎全方位地使用各種資料探勘技術,包括爬行、索引和搜尋。
主要問題?
挖掘方法、使用者互動、有效性與可伸縮性、資料型別的多樣性、資料探勘與社會。
資料探勘概念與技術 學習筆記1 引論
資料倉儲 多個異構資料來源在單個站點以統一的模式組織的儲存,以支援管理決策。資料倉儲 通過資料清理 資料變換 資料整合 資料裝入 定期資料重新整理來構造。資料倉儲技術包括 資料清理 資料整合 聯機分析處理 olap olap操作的例子包括上捲和下鑽。資料倉儲用資料立方體這種多維資料結構建模。知識發現...
資料探勘筆記 1 概念 資料準備
一.概念 資料探勘 運用基於計算機的方法,從資料中獲得有用之時的整個過程。兩個基本目標 和描述。資料探勘的基本任務 1 分類 2 回歸 3 聚類 4 總結概括 5 關聯建模 6 變化和偏差檢測 資料探勘的過程 陳述問題,闡明假設 收集資料 預處理資料 模型評估 挖掘資料 解釋模型,得出結論 資料倉儲...
資料探勘1基礎概念
機器學習 假設用p來估計計算機程在某個任務t上的效能,若乙個程式通過利用經驗e在t中獲得了效能改善,我們說關於t和p,該程式對e進行了學習。適用機器學習的地方 1 表現或目標能夠增進 2 不知道把規則寫下 3 一切學習從資料開始 人工智慧的核心主要使用歸納 綜合而不是演繹。機器學習的三要素 資料 模...