我很难根据变量是否在某个时间范围内在数据集中多次出现在R中创建虚拟变量。我已经尝试了各种命令,但没有一个能真正提供所需的结果...
我试图简化用于说明问题的两个表:第一个表(除其他变量外)包含“年”列和公司“ ID”列。第二个是第一个具有相同结构的子集。表1看起来像:
年份 公司ID
2004 x
2004年
2005年一个
2005 z
2006 x
2006年一个
2007年
2008 b
第二个看起来像这样:
年份 公司ID
2004 x
2004年
2005年一个
2006 x
2008 b
我需要一个虚拟变量作为 second 表中的新列,该变量检查是否每个公司ID(即每一行)都出现在 first 表中。在三年的时间范围内 (从第二张表中与公司ID相同的行中所示的年份开始)。例如第一行表2:虚拟= 1,这是公司x在2004-2006年期间多次出现在表1中。如果不是,则虚拟对象应等于0。
有什么办法可以创建这个假人吗?感谢您的帮助!