#資料探勘筆記(一)
本筆記在學習「清華大學-資料探勘:理論與演算法」時記錄、
資料儲量急劇增加,在2023年後資料發生了從模擬到數字的顯著轉變。
同時,算力也在大幅度增長。
international conference on data mining
international conference on data engineering
international conference on machine learning
international joint conference on artificial intelligence
pacific-asia conference on knowledge discovery and data mining
acm sigkdd conference on knowledge discovery and data mining
資料的定義
資料是代表變數或一組變數的定性或定量屬性的資訊。 資料通常被認為是從中獲得資訊和知識的最低抽象級別
資料的分類
連續型,二進位制
離散型,字串
符號型儲存結構
物理性質 01010101
邏輯性質 ldap資料庫,星型儲存結構
大資料3v特徵:資料量大volume(資料量由tb-zb);產生速度快velocity(batch-streaming data);資料種類龐大variety(從structured到unstructured)
開放資料(opendata)
法律上公開允許獲取,技術上公開容易獲取
資料探勘(datamining)
資料探勘是從通常龐大,不完整和嘈雜的資料中自動提取有趣且有用的隱藏模式的過程。
從資料到智慧型:資料庫-資料預處理-資料探勘-決策模型
文章首次發表於it筆記:
資料探勘筆記(一)
清華大學資料探勘課程幕課習題(第二章)
多選1.以下關於資料預處理的描述正確的是 1分 需要借助領域知識 核心內容就是缺失資料填充 資料探勘工作的基礎性工作 主要靠標準化演算法自動處理 單選2.小張的個人資訊中身份證號倒數第二位是單數,性別為女。這種情況被稱為 1分 missing data inconsistent data noisy...
資料探勘筆記(一)
資料 資料倉儲 資料探勘 模型評估 知識 資料分析 通過資料分析可以發現最有價值客戶,是組合銷售更有效率,留住那些最有價值客戶,用更小的成本發現欺詐現象。通訊業手機資料分析目的是為了方便快捷地管理使用者。但資料中包含了很多關於各個變數之間關係的資訊,這些資訊可被用來改進相關領域的決策。基礎在於資料庫...
資料探勘筆記(一)
資料 資料倉儲 資料探勘 模型評估 知識 資料分析 通過資料分析可以發現最有價值客戶,是組合銷售更有效率,留住那些最有價值客戶,用更小的成本發現欺詐現象。通訊業手機資料分析目的是為了方便快捷地管理使用者。但資料中包含了很多關於各個變數之間關係的資訊,這些資訊可被用來改進相關領域的決策。基礎在於資料庫...