**資料說明:**1-22個自變數x,23為因變數y
參考
library(mlbench)
library(caret)
#讀取資料
data<- read.csv("d:test.csv")
#轉換y,轉為分類問題
data$y<-as.factor(data$y)
#隨機數種子,可隨便設定(即選樣本時的間隔)
set.seed(11)
# funtions是做隨機森林的回歸
control <- rfecontrol(functions=rffuncs, method="cv",verbose = false, returnresamp = "final")
#[1:22]即22個因子所在列,[,23]即y,c(1:22)即遞迴留下的變數從1留到22
results <- rfe(data[,1:22],data[,23], sizes=c(1:22), rfecontrol=control)
# 輸出結果
print(results)
# 列出篩選出的變數
predictors(results)
# 畫出曲線
plot(results, type=c("g", "o"))
R語言 隨機森林演算法
在隨機森林方法中,建立大量的決策樹。每個觀察被饋入每個決策樹。每個觀察的最常見的結果被用作最終輸出。新的觀察結果被饋入所有的樹並且對每個分類模型取多數投票。對構建樹時未使用的情況進行錯誤估計。這稱為oob 袋外 誤差估計,其被提及為百分比。r語言包 randomforest 用於建立隨機森林。安裝r...
隨機森林(R)
random forest install.packages randomforest library randomforest data iris attach iris table iris species class as.factor iris species 描述 biplot princ...
R語言 訓練隨機森林模型
隨機森林演算法涉及對樣本單元和變數進行抽樣,從而生成大量決策樹。對於每個樣本單元,所有決策樹依次對其進行分類,所有決策樹 類別中的眾數類別即為隨機森林所 的這一樣本單元的類別。假設訓練集中共有n個樣本單元,m個變數,則隨機森林演算法如下 1 從訓練集中隨機有放回地抽取n個樣本單元,生成大量決策樹 2...