contents 目 錄
譯者序關於審稿人 前言
第1章
擴充套件你的資料探勘工具箱
1.1 什麼是資料探勘
1.2 如何進行資料探勘
1.2.1 fayyad等人的kdd過程
1.2.2 韓家煒等人的kdd過程
1.2.3 crisp-dm過程
1.2.4 六步過程
1.2.5 哪一種資料探勘方法最好
1.3 在資料探勘中使用哪些技術
1.4 如何建立資料探勘工作環境
1.5 小結
第2章
關聯規則挖掘
2.1 什麼是頻繁項集
2.1.1 都市傳奇「尿布與啤酒」
2.1.2 頻繁項集挖掘基礎知識
2.2 邁向關聯規則
2.2.1 支援度
2.2.2 置信度
2.2.3 關聯規則
2.2.4 包含資料的示例
2.2.5 附加值—修復計畫中的漏洞
2.2.6 尋找頻繁項集的方法
2.3 專案—發現軟體專案標籤中的關聯規則
2.4 小結
《Python資料探勘 概念 方法與實踐》一導讀
preface 前言 過去十年,資料儲存變得更便宜,硬體變得更快,演算法上也有了引人注目的進步,這一切為資料科學的快速興起鋪平了道路,並推動其發展成為計算領域最重要的機遇。雖然 資料科學 一詞可以包含從資料清理 資料儲存到用圖形圖表視覺化資料的所有環節,但該領域最重要的收穫是發明了智慧型 精密的資料...
資料探勘概念與技術 文字挖掘
1 文字檢索的基本度量 color red 準確率和召回率 color url 2 文字檢索方法 color red 向量空間模型 color url 3 文字索引技術 color red 1 倒排索引 color 一種索引結構,維持兩個雜湊索引表document table 文件表 和term t...
資料探勘概念與技術
在現實社會中的資料往往存在雜訊資料 缺失值和不一致資料的問題。為了提高資料探勘工作的效率和準確性,需要使用資料清理 資料整合 資料歸約和資料變換等方法對資料進行預處理操作。資料質量的三個要素是 準確性 完整性和一致性。資料清理試圖填充缺失值 光滑雜訊並識別離群點 糾正資料中的不一致。忽略元組。該方法...