資料探勘從字面意思來看在於「資料」和「挖掘」。資料有很多屬性,如型別、大小等,「挖掘」一般指挖掘有價值的「寶貝」,所以資料探勘是指在比較多的資料中尋找資料的價值。
資料探勘吸納了統計學、模式識別、資料庫、資料倉儲、視覺化、高效能計算等技術。
識別模式:生命體對環境及客體的識別,如人自己建立識別模式通過「光」和」聲」來分析自然界的客體。
視覺化:指資料探勘視覺化和資料探勘結果視覺化。
資料探勘產生是必然的,隨著人類的發展」知識體「越來越龐大,網際網路又使得資訊產生和傳播變得空間容易,產生了大量資料,急需一種技術從這些資料中獲得價值,把資料轉化為有組織的知識,對」簡單「的資料進行」簡單「的組織不能滿足」複雜」資料的」複雜「組織。
資料探勘就像沙子裡淘各種細小寶貝。
(1)資料清洗~洗掉沒用的雜質,防止干擾。
(2)資料分類、聚合~各種細小寶貝需要分類。
(3)資料分析
(4)評估
(4)分析結果視覺化。
什麼是資料探勘
當今資料庫的容量已經達到上萬億的水平 t 1,000,000,000,000個位元組。在這些大量資料的背後隱藏了很多具有決策意義的資訊,那麼怎麼得到這些 知識 呢?也就是怎樣通過一顆顆的樹木了解到整個森林的情況?電腦科學對這個問題給出的最新回答就是 資料探勘,在 資料礦山 中找到蘊藏的 知識金塊 幫...
什麼是資料探勘
簡單地說,資料探勘是指從大量資料中提取或 挖掘 知識。該術語實際上有點用詞不當。注意,從礦石或砂子挖掘 稱作 挖掘,而不是砂石挖掘。因此,資料探勘應當更正確地命名為 從資料中挖掘知識 遺憾的是這個詞有點長。圖1 3 資料探勘 在你的資料中搜尋知識 有趣的模式 圖1 4 資料探勘作為知識發現過程的乙個...
什麼是資料探勘
什麼是資料探勘?簡單地說,資料探勘是指從大量資料中提取或 挖掘 知識。該術語實際上有點用詞不當。注意,從礦石或砂子挖掘 稱作 挖掘,而不是砂石挖掘。因此,資料探勘應當更正確地命名為 從資料中挖掘知識 遺憾的是這個詞有點長。知識挖掘 是乙個較短的術語,但不能反映從大量資料中挖掘。畢竟,挖掘是乙個很生動...