R語言 隨機森林遞迴特徵消除

2021-10-04 17:10:42 字數 653 閱讀 1621

**資料說明:**1-22個自變數x,23為因變數y

參考

library(mlbench)

library(caret)

#讀取資料

data<- read.csv("d:test.csv")

#轉換y,轉為分類問題

data$y<-as.factor(data$y)

#隨機數種子,可隨便設定(即選樣本時的間隔)

set.seed(11)

# funtions是做隨機森林的回歸

control <- rfecontrol(functions=rffuncs, method="cv",verbose = false, returnresamp = "final")

#[1:22]即22個因子所在列,[,23]即y,c(1:22)即遞迴留下的變數從1留到22

results <- rfe(data[,1:22],data[,23], sizes=c(1:22), rfecontrol=control)

# 輸出結果

print(results)

# 列出篩選出的變數

predictors(results)

# 畫出曲線

plot(results, type=c("g", "o"))

R語言 隨機森林演算法

在隨機森林方法中,建立大量的決策樹。每個觀察被饋入每個決策樹。每個觀察的最常見的結果被用作最終輸出。新的觀察結果被饋入所有的樹並且對每個分類模型取多數投票。對構建樹時未使用的情況進行錯誤估計。這稱為oob 袋外 誤差估計,其被提及為百分比。r語言包 randomforest 用於建立隨機森林。安裝r...

隨機森林(R)

random forest install.packages randomforest library randomforest data iris attach iris table iris species class as.factor iris species 描述 biplot princ...

R語言 訓練隨機森林模型

隨機森林演算法涉及對樣本單元和變數進行抽樣,從而生成大量決策樹。對於每個樣本單元,所有決策樹依次對其進行分類,所有決策樹 類別中的眾數類別即為隨機森林所 的這一樣本單元的類別。假設訓練集中共有n個樣本單元,m個變數,則隨機森林演算法如下 1 從訓練集中隨機有放回地抽取n個樣本單元,生成大量決策樹 2...