我希望离散化machine-learning数据集中的连续特征,尤其是使用受监督的discretisation。事实证明,r [对此有一种包装/方法] 1,太好了!但是由于我不精通R,所以遇到了一些问题,如果您能提供帮助,我将不胜感激。
我收到错误
类变量需要成为一个因素。
我在网上看了一个例子,他们似乎没有这个问题,但是我知道。请注意,除了V2 ~ .
应该是列名之外,我不太了解syntax V2
。
library(caret)
library(Rcpp)
library(arulesCBA)
filename <- "wine.data"
dataset <- read.csv(filename,header=FALSE)
dataset2 <- discretizeDF.supervised(V2 ~ .,dataset,method = "mdlp")
R报告以下错误:
.parseformula(公式,数据)中的错误:需要将类变量设置为 一个因素!
您可以在以下位置找到数据集wine.data:https://pastebin.com/hvDbEtMN discretizeDF.supervised的第一个参数是一个公式,这似乎是问题所在。
请帮助!预先谢谢你。