我想根据ID本身前几年的组值在组变量中填充数据集的NA。
代码的na.locf(newData,na.rm = TRUE)
部分无效。我认为这是因为输入的不是数字。还是另一件事?
有人知道如何解决此问题吗?
for (i in my_data$ID){
newData = my_data[my_data$ID==i,c('ID','Year','group')][3]
na.locf(newData,na.rm = TRUE)
}
我的数据集很大。 但我将其作为我需要的示例:
structure(list(ID = c(1L,2L,3L,1L,1L),Year = c(2000L,2000L,2001L,2002L,2003L),Group = structure(c(2L,4L),.Label = c("","\"A\"","\"B\"","\"C\""),class = "factor")),row.names = c(NA,6L),class = "data.frame")
结果应该是这样的:
structure(list(ID = c(1L,2L),2003L,2002L),Group = structure(c(1L,.Label = c("\"A\"",class = "data.frame")