R - 前端之家

2024-05-05 • 问答

我有一个数据集，可以对胜诉案件（14399）和败诉案件（8677）进行分类。数据集具有912个预测变量。我试图对丢失的案件进行过度采样，以使与赢取的案件数量几乎相同（因此，每个赢取和丢失的案件都有14399个案件）。

TARGET是丢失（0）和赢得（1）情况的列：

table(dat_train$TARGET)

    0     1 
 8677 14399

现在我正在尝试使用ROSE ovun.sample平衡它们

dat_train_bal <- ovun.sample(dat_train$TARGET~.,data = dat_train,p=0.5,seed = 1,method = "over")

我收到此错误：

Error in parse(text = x,keep.source = FALSE) : 
  <text>:1:17538: unexpected symbol
1: PPER_409030143+BP_RESPPER_9639064007+BP_RESPPER_7459058285+BP_RESPPER_9339059882+BP_RESPPER_9339058664+BP_RESPPER_5209073603+BP_RESPPER_5209061378+CRM_CURRPH_Initiation+Quotation+CRM_CURRPH_Ne

有人可以帮忙吗？谢谢：-）

R

bangwancooler 回答：R

大家都在问