这是另一个问题的后续问题, R Question - Trying to use separate to split data with a non-constant delimiter
直到后来我才意识到我还有其他问题,请多多包涵,谢谢!
我以“ agement_age_group”为例,将其分为“成人”,“青少年”和“儿童”,以便每次事件都可以得出每个年龄段参与者的人数。我正在尝试对年龄和性别做同样的事,然后将其与整个数据集联系起来进行预测。让我知道您是否需要更多细节。
dput(head(x[,c(1,3)])) structure(list(incident=c(1,2),age_group= c("0::Adult 18+","0::Adult 18+||1::Adult 18+"),participant_gender = c("0::Female","0::Male||1::Male")),.Names = c("incident","participant_age_group","participant_gender"),row.names = c(NA,2L),class = "data.frame")
如果需要更多数据, Sample Data from the dataset
我尝试使用下面的方法,但是它只给出了一个庞大的向量。
字符串
x
期望的结果
Incident Child Teen Adult Female Male
1 0 0 1 1 0
2 0 0 2 0 2