我有一个数据集,可以对胜诉案件(14399)和败诉案件(8677)进行分类。数据集具有912个预测变量。 我试图对丢失的案件进行过度采样,以使与赢取的案件数量几乎相同(因此,每个赢取和丢失的案件都有14399个案件)。
TARGET是丢失(0)和赢得(1)情况的列:
table(dat_train$TARGET)
0 1
8677 14399
现在我正在尝试使用ROSE ovun.sample平衡它们
dat_train_bal <- ovun.sample(dat_train$TARGET~.,data = dat_train,p=0.5,seed = 1,method = "over")
我收到此错误:
Error in parse(text = x,keep.source = FALSE) :
<text>:1:17538: unexpected symbol
1: PPER_409030143+BP_RESPPER_9639064007+BP_RESPPER_7459058285+BP_RESPPER_9339059882+BP_RESPPER_9339058664+BP_RESPPER_5209073603+BP_RESPPER_5209061378+CRM_CURRPH_Initiation+Quotation+CRM_CURRPH_Ne
有人可以帮忙吗? 谢谢:-)