R

我有一个数据集,可以对胜诉案件(14399)和败诉案件(8677)进行分类。数据集具有912个预测变量。 我试图对丢失的案件进行过度采样,以使与赢取的案件数量几乎相同(因此,每个赢取和丢失的案件都有14399个案件)。

TARGET是丢失(0)和赢得(1)情况的列:

table(dat_train$TARGET)

    0     1 
 8677 14399 

现在我正在尝试使用ROSE ovun.sample平衡它们

dat_train_bal <- ovun.sample(dat_train$TARGET~.,data = dat_train,p=0.5,seed = 1,method = "over")

我收到此错误:

Error in parse(text = x,keep.source = FALSE) : 
  <text>:1:17538: unexpected symbol
1: PPER_409030143+BP_RESPPER_9639064007+BP_RESPPER_7459058285+BP_RESPPER_9339059882+BP_RESPPER_9339058664+BP_RESPPER_5209073603+BP_RESPPER_5209061378+CRM_CURRPH_Initiation+Quotation+CRM_CURRPH_Ne

有人可以帮忙吗? 谢谢:-)

bangwancooler 回答:R

从伪造的示例中复制代码我发现您的公式dat_train$TARGET~.中的错误需要更正为{​​{1}}

TARGET~.
本文链接:https://www.f2er.com/3137812.html

大家都在问