一、資料預處理
獲取資料:
r軟體如何選取資料?
r語言如何實現資料抽樣?
r軟體如何獲取檔案資料?
資料探索:
4.r語言資料探索分析-1
5.r語言資料探索分析-2(視覺化)
資料清洗:
6. r語言缺失值的處理——回歸**法
7.r語言如何在散點圖中進行樣本點標記?
二、基本演算法
關聯分析:
1.r語言關聯分析操作步驟
聚類分析:
2.r語言實現期望最大化聚類(em演算法)
3.r語言實現密度聚類
4.r語言實現系譜聚類
5.r語言k-中心點聚類分析
6.r語言kmeans聚類分析
判別分析:
7.r語言如何實現k最近鄰演算法?
8.r語言樸素貝葉斯分類實操
9.r語言如何進行線性判別分析?
決策樹:
10.如何利用r語言中的rpart函式建立決策樹模型
三、高階演算法與資料探勘
整合學習:
1.r語言實現adaboost演算法
2.r語言實現bagging演算法
隨機森林:
3.r語言實現隨機森林randomforest
神經網路:
4.r語言如何實現神經網路演算法?
svm:
5.r語言如何實現支援向量機?
R語言 密度聚類
動態聚類往往聚出來的類有點圓形或者橢圓形。基於密度掃瞄的演算法能夠解決這個問題。思路就是定乙個距離半徑,定最少有多少個點,然後把可以到達的點都連起來,判定為同類。在r中的實現 library fpc newiris ds showplot t,method raw 畫出來明顯不對 把距離調小了一點 ...
R語言 系統聚類 K值聚類
1 系統聚類 系統聚類是將每個樣品分成若干類的方法,其基本思想是 先將各個樣品各看成一類,然後規定類與類之間的距離,選擇距離最小的一對合併成新的一類,計算新類與其他類之間的距離,再將距離最近的兩類合併,這樣每次減少一類,直至所有的樣品合為一類為止。聚類方法 最短距離法和最長距離法 重心法和類平均法 ...
R語言中K Means聚類演算法
設定工作空間 把 資料及程式 資料夾拷貝到f盤下,再用setwd設定工作空間 setwd e r workspace r語言資料分析與挖掘實戰 chp5 讀入資料 data read.csv data consumption data.csv header true 2 4 view data fi...