聚類:
常用的包: fpc,cluster,pvclust,mclust 基於劃分的方法: kmeans, pam, pamk, clara 基於層次的方法: hclust, pvclust, agnes, diana 基於模型的方法: mclust 基於密度的方法: dbscan 基於畫圖的方法: plotcluster, plot.hclust 基於驗證的方法: cluster.stats
分類:常用的包: rpart,party,randomforest,rpartordinal,tree,margintree,maptree,survival 決策樹: rpart, ctree 隨機森林: cforest, randomforest 回歸, logistic回歸, poisson回歸: glm, predict, residuals 生存分析: survfit, survdiff, coxph
關聯規則:
常用的包: arules:支援挖掘頻繁項集,最大頻繁項集,頻繁閉專案集和關聯規則 drm:回歸和分類資料的重複關聯模型 apriori演算法,廣度rst演算法:apriori, drm eclat演算法: 採用等價類,rst深度搜尋和集合的交集: eclat
序列模式:
常用的包: arulessequences spade演算法: cspade
時間序列:
常用的包: timsac 時間序列構建函式: ts 成分分解: decomp, decompose, stl, tsr
統計:常用的包: base r, nlme 方差分析: aov, anova 密度分析: density 假設檢驗: t.test, prop.test, anova, aov 線性混合模型:lme 主成分分析和因子分析:princomp
圖表:條形圖: barplot 餅圖: pie 散點圖: dotchart 直方圖: hist 密度圖: densityplot 蠟燭圖, 箱形圖 boxplot qq (quantile-quantile) 圖: qqnorm, qqplot, qqline bi-variate plot: coplot 樹: rpart parallel coordinates: parallel, paracoor, parcoord 熱圖, contour: contour, filled.contour 其他圖: stripplot, sunflowerplot, interaction.plot, matplot, fourfoldplot,assocplot, mosaicplot 儲存的圖**式: pdf, postscript, win.metafile, jpeg, bmp, png
1、聚類
2、分類
3、關聯規則與頻繁項集
4、序列模式
5、時間序列
6、統計
7、圖表
8、資料操作
9、與資料探勘軟體weka做介面
R語言常用資料探勘包
今天發現乙個很不錯的部落格 博主致力於研究r語言在資料探勘方面的應用,正好近期很想系統的學習一下r語言和資料探勘的整個流程,看了這個部落格的內容,心裡久久不能平靜。決定從今天開始 今天發現乙個很不錯的部落格 博主致力於研究r語言在資料探勘方面的應用,正好近期很想系統的學習一下r語言和資料探勘的整個流...
R語言常用資料探勘包
今天發現乙個很不錯的部落格 博主致力於研究r語言在資料探勘方面的應用,正好近期很想系統的學習一下r語言和資料探勘的整個流程,看了這個部落格的內容,心裡久久不能平靜。決定從今天開始 今天發現乙個很不錯的部落格 博主致力於研究r語言在資料探勘方面的應用,正好近期很想系統的學習一下r語言和資料探勘的整個流...
R 資料探勘有關或者有幫助的R包和函式的集合
與資料探勘有關或者有幫助的r包和函式的集合。1 聚類 常用的包 fpc,cluster,pvclust,mclust 基於劃分的方法 kmeans,pam,pamk,clara 基於層次的方法 hclust,pvclust,agnes,diana 基於模型的方法 mclust 基於密度的方法 dbs...