資料探勘筆記(一) 清華大學 資料探勘 理論與演算法

2021-10-10 18:51:01 字數 1164 閱讀 2847

#資料探勘筆記(一)

本筆記在學習「清華大學-資料探勘:理論與演算法」時記錄、

資料儲量急劇增加,在2023年後資料發生了從模擬到數字的顯著轉變。

同時,算力也在大幅度增長。

international conference on data mining

international conference on data engineering

international conference on machine learning

international joint conference on artificial intelligence

pacific-asia conference on knowledge discovery and data mining

acm sigkdd conference on knowledge discovery and data mining

資料的定義

資料是代表變數或一組變數的定性或定量屬性的資訊。 資料通常被認為是從中獲得資訊和知識的最低抽象級別

資料的分類

連續型,二進位制

離散型,字串

符號型儲存結構

物理性質 01010101

邏輯性質 ldap資料庫,星型儲存結構

大資料3v特徵:資料量大volume(資料量由tb-zb);產生速度快velocity(batch-streaming data);資料種類龐大variety(從structured到unstructured)

開放資料(opendata)

法律上公開允許獲取,技術上公開容易獲取

資料探勘(datamining)

資料探勘是從通常龐大,不完整和嘈雜的資料中自動提取有趣且有用的隱藏模式的過程。

從資料到智慧型:資料庫-資料預處理-資料探勘-決策模型

文章首次發表於it筆記:

資料探勘筆記(一)

清華大學資料探勘課程幕課習題(第二章)

多選1.以下關於資料預處理的描述正確的是 1分 需要借助領域知識 核心內容就是缺失資料填充 資料探勘工作的基礎性工作 主要靠標準化演算法自動處理 單選2.小張的個人資訊中身份證號倒數第二位是單數,性別為女。這種情況被稱為 1分 missing data inconsistent data noisy...

資料探勘筆記(一)

資料 資料倉儲 資料探勘 模型評估 知識 資料分析 通過資料分析可以發現最有價值客戶,是組合銷售更有效率,留住那些最有價值客戶,用更小的成本發現欺詐現象。通訊業手機資料分析目的是為了方便快捷地管理使用者。但資料中包含了很多關於各個變數之間關係的資訊,這些資訊可被用來改進相關領域的決策。基礎在於資料庫...

資料探勘筆記(一)

資料 資料倉儲 資料探勘 模型評估 知識 資料分析 通過資料分析可以發現最有價值客戶,是組合銷售更有效率,留住那些最有價值客戶,用更小的成本發現欺詐現象。通訊業手機資料分析目的是為了方便快捷地管理使用者。但資料中包含了很多關於各個變數之間關係的資訊,這些資訊可被用來改進相關領域的決策。基礎在於資料庫...