作为一个例子,让我们使用虹膜数据集。
data(iris)
smp_size <- floor(0.75 * nrow(iris))
train_ind <- sample(seq_len(nrow(iris)),size = smp_size)
train <- iris[train_ind,]
test <- iris[-train_ind,]
有没有一种方法来训练(在火车上)基于树的增强算法(例如GBM),然后提取树并使用它们中的每一个来预测测试集上的响应变量?在装袋的情况下,将使用在随机森林对象上评估的predict()函数的$ individual值。
model <- randomForest(Species~.,data = train,proximity=TRUE,ntree=numTree)
trees <- predict(model,train,predict.all=TRUE)$individual
谢谢!