資料探勘學習筆記(一)

2021-10-02 19:35:34 字數 621 閱讀 5309

資料分析與資料探勘

1.資料分析

採用適當的統計分析方法對收集到的資料進行分析、概括和總結,對資料進行恰當的描述,提取有用的資訊的過程。

2.資料探勘(data mining,dm)

從海量的資料中通過相關的演算法來發現隱藏在資料中的規律和知識的過程。

為什麼要進行資料探勘呢?

通常將資料探勘視為資料中「知識發現」的同義詞,也可以認為資料探勘是知識發現中的乙個步驟。

3.知識發現(kdd)的過程

首先要對收集到的資料進行預處理(資料清洗與資料整合),然後將資料倉儲中的資料進行選擇與變換,以便從資料倉儲中選擇與任務相關的資料,然後將這些資料轉化為可以進行資料探勘的形式,進行模式評估、知識表示。

4.資料分析與資料探勘的區別

資料分析處理的資料量不一定很大,目標比較明確,側重於展現資料之間的關係。

資料探勘處理的是海量的資料量,目標不明確,側重於對未知的情況進行**和估計。

5.資料分析與資料探勘的聯絡

資料分析的結果需要進一步的挖掘,才能得到更加清晰的結果。

資料探勘獲得知識的過程也需要對資料探勘的結果進一步分析。

資料分析可以將資料轉變成資訊,資料探勘可以將資訊變成知識。

資料探勘學習筆記一 緒論

資料收集以及資料儲存技術的提高,方便了人們收集到大量的資料,而傳統的資料分析方法不能對海量的資料提取處有用的資訊。再次背景下,新的資料探勘技術誕生。資料探勘作為一種技術,是將傳統的資料分析方法與處理大量資料的複雜演算法相結合。資料探勘在商業以及醫學 科學及工程中有很重要的運用。一 什麼是資料探勘 資...

《資料探勘導論》學習筆記(一)

四種主要的資料探勘任務 1 建模任務 2 關聯分析 3 聚類分析 4 異常檢測 主要的資料質量問題 存在雜訊和離群點,資料遺漏 不一致或重複,資料有偏差,或者在別的方面,資料不代表描述所設想的現象或總體情況。資料集主要分為三類 記錄資料,基於圖形的資料 有序的資料 一般資料集的三個特性 記錄資料的不...

資料探勘筆記(一)

資料 資料倉儲 資料探勘 模型評估 知識 資料分析 通過資料分析可以發現最有價值客戶,是組合銷售更有效率,留住那些最有價值客戶,用更小的成本發現欺詐現象。通訊業手機資料分析目的是為了方便快捷地管理使用者。但資料中包含了很多關於各個變數之間關係的資訊,這些資訊可被用來改進相關領域的決策。基礎在於資料庫...