1 資料探勘概念筆記 引論

2021-07-09 03:39:20 字數 1266 閱讀 2286

1.資料探勘概念筆記——引論

感覺不錯,讀之並記之。

章節也是按照書中章節來,此處只是筆記,記錄一些重要的概念和核心的思想。

為什麼要進行資料探勘?

答:需要是發明之母——柏拉圖;

資訊時代每天產生的資料海量,不得不需要從中進行挖掘。

資料探勘有什麼用?

答:可以將大型資料集轉化成知識。

此外,資料探勘是資訊科技的進化。

資訊科技從資料收集、資料庫建立、資料管理(包括資料儲存和檢索)到高階資料分析(資料倉儲和資料探勘)前進。

資料探勘技術包括資料清理、資料繼承和聯機分析處理(olap)

什麼是資料探勘?

答:從資料中挖掘知識,也有人把資料探勘視為資料中的知識發現(kdd)

不過知識發現包括以下幾個步驟:

a)        資料清理

b)        資料整合

c)        資料選擇

d)        資料變換

e)        資料探勘

f)         資料評估

g)        知識表示

可以挖掘哪些資料?   

答:對於挖掘的應用,最基本形式是資料庫資料、資料倉儲資料和事務資料。

可以挖掘什麼型別的模式?

答:資料探勘功能,包括特徵化與區分,頻繁模式、關聯和相關性挖掘,分類與回歸,聚類分析,離群點分析。資料探勘功能用於指定資料探勘任務發現的模式,一般而言,這些任務可以分為兩個:描述性和**性。

需要什麼技術?

答:統計學、機器學習、模式識別、資料庫和資料倉儲、資訊檢索、視覺化、演算法、高效能計算和許多應用領域的大量技術。

當然每個技術展開都是乙個龐大的分支。但是不是說搞資料探勘就需要懂得所有的技術的。根據需求需要不同的技術。

應用場景?

當前比較成功和流行的應用例子:商務智慧型和搜尋引擎。

商務智慧型技術提供商務運作的歷史、現狀和**檢視。

搜尋引擎全方位地使用各種資料探勘技術,包括爬行、索引和搜尋。

主要問題?

挖掘方法、使用者互動、有效性與可伸縮性、資料型別的多樣性、資料探勘與社會。

資料探勘概念與技術 學習筆記1 引論

資料倉儲 多個異構資料來源在單個站點以統一的模式組織的儲存,以支援管理決策。資料倉儲 通過資料清理 資料變換 資料整合 資料裝入 定期資料重新整理來構造。資料倉儲技術包括 資料清理 資料整合 聯機分析處理 olap olap操作的例子包括上捲和下鑽。資料倉儲用資料立方體這種多維資料結構建模。知識發現...

資料探勘筆記 1 概念 資料準備

一.概念 資料探勘 運用基於計算機的方法,從資料中獲得有用之時的整個過程。兩個基本目標 和描述。資料探勘的基本任務 1 分類 2 回歸 3 聚類 4 總結概括 5 關聯建模 6 變化和偏差檢測 資料探勘的過程 陳述問題,闡明假設 收集資料 預處理資料 模型評估 挖掘資料 解釋模型,得出結論 資料倉儲...

資料探勘1基礎概念

機器學習 假設用p來估計計算機程在某個任務t上的效能,若乙個程式通過利用經驗e在t中獲得了效能改善,我們說關於t和p,該程式對e進行了學習。適用機器學習的地方 1 表現或目標能夠增進 2 不知道把規則寫下 3 一切學習從資料開始 人工智慧的核心主要使用歸納 綜合而不是演繹。機器學習的三要素 資料 模...