資料探勘(一)簡介

2021-09-29 00:03:21 字數 603 閱讀 5099

資料(英語:data),是指未經過處理的原始記錄。

大資料是指無法在一定時間內用常規軟體工具對其內容進行抓取、管理和處理的資料集合。

(也就是利用常用軟體工具獲取,管理和處理資料所消耗的時間超過可容忍的時間的資料集)

5個特徵:

volume:資料量大,包括採集、儲存和計算的量都非常大。

value:資料價值密度相對較低,或者說是浪裡淘沙卻又彌足珍貴。

velocity:資料增長速度快,處理速度也快,時效性要求高。

veracity:資料的準確性和可信賴度,即資料的質量。

參考:資料探勘(data mining)就是從大量的、不完全的、有雜訊的、模糊的、隨機的實際應用資料中,提取隱含在其中的、規律性的、人們事先未知的、但又是潛在有用的並且最終可理解的資訊和知識的非平凡過程。

(也就是從資料庫的大量資料中挖掘出有用的資訊)

事先未知的:即資訊的新穎性

潛在有用的:發現的資訊將來有實際效用(常識性的無意義)

最終可理解的:發現的模式能被使用者理解

非平凡:通常指資料探勘過程不是線性的

參考:從大資料集中尋找其規律的技術。

資料探勘技術簡介

1.引言 資料探勘 data mining 是從大量的 不完全的 有雜訊的 模糊的 隨機的資料中提取隱含在其中的 人們事先不知道的 但又是潛在有用的資訊和知識的過程。隨著資訊科技的高速發展,人們積累的資料量急劇增長,動輒以tb計,如何從海量的資料中提取有用的知識成為當務之急。資料探勘就是為順應這種需...

資料探勘技術簡介

摘要 資料探勘是目前一種新的重要的研究領域。本文介紹了資料探勘的概念 目的 常用方法 資料探勘過程 資料探勘軟體的評價方法。對資料探勘領域面臨的問題做了介紹和展望。1.引言 資料探勘 data mining 是從大量的 不完全的 有雜訊的 模糊的 隨機的資料中提取隱含在其中的 人們事先不知道的 但又...

2 資料探勘簡介

資料探勘 dm data mining 是乙個跨學科的電腦科學分支,它是用人工智慧 機器學 習 統計學和資料庫的交叉方法在相對較大型的資料集中發現模式的計算過程。資料探勘過程 的總體目標是從乙個資料集中提取資訊,並將其轉換成可理解的結構,以進一步使用。除了原 始分析步驟,它還涉及到資料庫和資料管理方...