我希望R基于标识符变量INTERVIEW_DATE
在另一个数据集中寻找某个变量TUCASEID
的信息,这在两个数据集中都是相同的,并将其写到我所在的数据集中一起工作。两个数据集的大小不同。第一个有412,611个,其他有20,720个。
我想这有点像在Excel中进行查找。
我想填写的数据:
TUCASEID AGE MALE BLACK YEAR DATASET INTERVIEW_DAY INTERVIEW_DATE
1 2.0030100e+13 60 1 1 2003 2003 5 NA
2 2.0030100e+13 41 0 0 2003 2003 6 NA
3 2.0030100e+13 26 0 0 2003 2003 6 NA
4 2.0030100e+13 36 0 1 2003 2003 4 NA
5 2.0030100e+13 51 1 0 2003 2003 4 NA
6 2.0030100e+13 32 0 0 2003 2003 4 NA
7 2.0030100e+13 44 0 0 2003 2003 1 NA
8 2.0030100e+13 21 0 0 2003 2003 2 NA
9 2.0030100e+13 33 0 0 2003 2003 6 NA
10 2.0030100e+13 39 0 1 2003 2003 4 NA
带有有关变量INTERVIEW_DATE
的必要信息的源数据:
TUCASEID AGE MALE BLACK YEAR DATASET INTERVIEW_DAY INTERVIEW_DATE
1 2.00301e+13 60 1 1 2003 2003 5 03Jan2003
2 2.00301e+13 60 1 1 2003 2003 5 03Jan2003
3 2.00301e+13 60 1 1 2003 2003 5 03Jan2003
4 2.00301e+13 60 1 1 2003 2003 5 03Jan2003
5 2.00301e+13 60 1 1 2003 2003 5 03Jan2003
6 2.00301e+13 60 1 1 2003 2003 5 03Jan2003
7 2.00301e+13 60 1 1 2003 2003 5 03Jan2003
8 2.00301e+13 60 1 1 2003 2003 5 03Jan2003
9 2.00301e+13 60 1 1 2003 2003 5 03Jan2003
10 2.00301e+13 41 0 0 2003 2003 6 04Jan2003
谢谢。