《R語言資料探勘 實用專案解析》 導讀

2021-09-23 14:56:31 字數 1356 閱讀 1459

隨著資料規模和種類的增長,應用資料探勘技術從大資料中提取有效資訊變得至關重要。這是因為企業認為有必要從大規模資料的實施中獲得相應的投資回報。實施資料探勘的根本性原因是要從大型資料庫中發現隱藏的商機,以便利益相關者能針對未來業務做出決策。資料探勘不僅能夠幫助企業降低成本以及提高收益,還能幫助他們發現新的發展途徑。

本書將介紹使用r語言(一種開源工具)進行資料探勘的基本原理。r是一門免費的程式語言,同時也是乙個提供統計計算、圖形資料視覺化和**建模的軟體環境,並且可以與其他工具和平台相整合。本書將結合r語言在示例資料集中的應用來闡釋資料探勘原理。

本書將闡述資料探勘的一些主題,如數學表述、在軟體環境中的實現,以及如何據此來解決商業問題。本書的設計理念是,讀者可以從資料管理技術、探索性資料分析、資料視覺化等內容著手學習,循序漸進,直至建立高階**模型(如推薦系統、神經網路模型)。本書也從資料科學、分析學、統計建模以及視覺化等角度對資料探勘這一概念進行了綜述。

[第1章 使用r內建資料進行資料處理

1.1 什麼是資料探勘 ](

1.2 r語言引論

1.2.1 快速入門

1.2.2 資料型別、向量、陣列與矩陣

1.2.3 列表管理、因子與序列

1.2.4 資料的匯入與匯出

1.3 資料型別轉換

1.4 排序與合併資料框

1.5 索引或切分資料框

1.6 日期與時間格式化

1.7 建立新函式

1.7.1 使用者自定義函式

1.7.2 內建函式

1.8 迴圈原理——for迴圈

1.9 迴圈原理——repeat迴圈

1.10 迴圈原理——while迴圈

1.12 字串操作

1.13 缺失值(na)的處理

小結 [第2章 汽車資料的探索性分析

2.1 一元分析 ](

2.2 二元分析

2.3 多元分析

2.4 解讀分布和變換

2.4.1 正態分佈

2.4.2 二項分布

2.4.3 泊松分布

2.5 解讀分布

2.6 變數分段

2.7 列聯表、二元統計及資料正態性檢驗

2.8 假設檢驗

2.8.1 總體均值檢驗

2.8.2 雙樣本方差檢驗

2.9 無引數方法

2.9.1 wilcoxon符號秩檢驗

2.9.2 mann-whitney-wilcoxon檢驗

2.9.3 kruskal-wallis檢驗

小結

《R語言機器學習 實用案例分析》 導讀

譯者序前言 關於作者 關於審稿人 第1章 開始使用r語言和機器學習 1.1 r的基本內容 1.2 r的資料結構 1.3 使用函式 1.4 控制 流 1.5 高階結構 1.6 進一步使用r 1.7 機器學習基礎 1.8 總結 第2章 讓我們進行機器學習 2.1 理解機器學習 2.2 機器學習演算法 2...

R語言資料探勘資料

包含理論知識與rpart包例項。包含演算法的自行實現,以及rweka包的c4.5演算法 tree包的cart演算法。離散選擇模型大師kenneth train的個人主頁,提供了matlab r和gauss的源 個人推薦r 中的rsghb包,採用的估計方法是hierarchical bayes演算法,...

《R語言資料探勘》 1 3 資料探勘

1.3 資料探勘 資料探勘就是在資料中發現乙個模型,它也稱為探索性資料分析,即從資料中發現有用的 有效的 意想不到的且可以理解的知識。有些目標與其他科學,如統計學 人工智慧 機器學習和模式識別是相同的。在大多數情況下,資料探勘通常被視為乙個演算法問題。聚類 分類 關聯規則學習 異常檢測 回歸和總結都...