我有一个从SQL导出的数据集,其格式如下:
> head(my_data)
# A tibble: 6 x 19
referencedate var1 var2 cases var3 var4 var5
<dttm> <dbl> <dbl> <dbl> <chr> <dbl> <dbl>
1 2008-03-31 00:00:00 1 1 1 255124~ -1 -1
2 2008-03-31 00:00:00 1 1 3 441344~ -1 -1
3 2008-03-31 00:00:00 1 1 5 133497~ 1 0
4 2008-03-31 00:00:00 1 1 7 343242~ 1 -1
5 2008-03-31 00:00:00 1 1 100 292297~ 1 -1
6 2008-03-31 00:00:00 1 1 1 159941~ -1 0
如果我进行逻辑回归,该软件会认为每一行都是一个观察值,而根据个案的值,会有多个观察值相同的观察值。如何将其纳入分析?可以通过为case> 1时生成多行来完成,或者通过其他方式...