資料探勘相關概念 summary

2022-03-10 04:48:11 字數 1040 閱讀 3847

1.資料庫和資料管理產業在一些關鍵功能的開發上不斷發展:資料收集和資料庫建立、資料管理(包括資料儲存和檢索、資料庫事務處理)和高階資料分析(包括資料倉儲和資料探勘)。

2.資料倉儲:這是一種多個異構資料來源在單個站點以統一的模式組織的儲存,以支援決策管理。資料倉儲技術包括資料清理、資料整合和聯機分析處理(olap)。

3.許多人把資料探勘視為另乙個流行術語資料中的知識發現(kdd)的同義詞,而另一些人只是把資料探勘視為知識發現過程的乙個基本步驟。

4.資料探勘過程:資料清理(消除雜訊和刪除不一致資料);資料整合(多種資料來源可以組合在一起);資料選擇(從資料庫中提取與分析任務相關的資料);資料變換(通過彙總或聚集操作,把資料變換和統一成適合挖掘的形式);資料探勘(基本步驟,使用智慧型方法提取資料模式);模式評估(根據某種興趣度度量,識別代表知識的真正有趣的模式。);知識表示(使用視覺化和知識表示技術,向使用者提供挖掘的知識)。

5.資料探勘是從大量資料中挖掘有趣模式和知識的過程。

6.資料庫系統,也稱資料庫管理系統(dbms),由一組內部相關的資料(稱做資料庫)和一組管理和訪問資料的軟體程式組成。軟體程式提供如下機制:定義資料庫結構和資料儲存,說明和管理併發、共享或分布式資料訪問,面對系統癱瘓或未授權的訪問,確保儲存的資訊的一致性和安全性。

7.關聯式資料庫是表的匯集,每個表都被賦予乙個唯一的名字。每個表都包含一組屬性(列或字段),並且通常存放大量元組(記錄或行)。關係表中的每個元組代表乙個物件,被唯一的關鍵字標識,並被一組屬性值描述。通常為關聯式資料庫構建語義資料模型,如實體-聯絡(er)資料模型。er資料模型將資料庫表示成一組實體和它們之間的聯絡。

8、資料倉儲用稱作資料立方體(data cube)的多維資料結構建模。其中每個維對應於模式中的乙個或一組屬性,而每個單元存放某種聚集度量值。資料立方體提供資料的多維檢視,並允許預計算和快速訪問彙總資料。

9.乙個模式是有趣的,如果它:1)易於被人理解;2)在某種確信度上,對於新的或檢驗資料是有效的;3)是潛在有用的;4)是新穎的。

10.存在一些模式興趣度的客觀度量。這些度量基於所發現模式的結構和關於它們的統計量。對於形如x=>y的關聯規則,一種客觀度量是規則的支援度.

資料探勘概念

資料探勘是從海量的資料中抽取感興趣的 有價值的 隱含的 以前沒有用但是潛在有用資訊的 模式和知識的過程。資料探勘是從存放在資料庫 資料倉儲中或其它資訊庫中的大量資料中挖掘有趣知識的過程。研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能。分類 ...

資料探勘概念複習

資料探勘側重應用,理論不是很難理解,快考試了,回顧一下常見的概念。資料探勘其實就是在一堆資料裡找規律來 資料探勘的過程主要有資料準備和資料探勘,資料準備的過程很重要,甚至超過了挖掘,涉及到的概念有資料倉儲 資料整合 資料探勘主要解決四類問題 分類問題 聚類問題 關聯問題 問題。資料倉儲其實也是乙個資...

資料探勘學習之路 1 相關概念

在同濟讀研期間,無意間選擇了資料倉儲和資料探勘作為研究方向,從此走上了漫漫bi之路。研究生畢業以後,抵制了外企的 因為無法做bi相關的專業工作 加入了上海電力下屬的it公司,從事電力營銷資料倉儲的建設,真正將知識轉化成生產力,自己也親身經歷如何實施大型資料倉儲,此後跳槽另一家民企,接觸了移動經營分析...