我有一个面板数据集,其中包含很多隐藏的缺失观测值。
在数百个国家/地区,我的数据看起来像这样。
df <- data.frame("Country" = c("Yugoslavia","Yugoslavia","USA","USA"),"Year" = c(1989,1991,1992,1990,1993),"Var" = runif(6,min=0,max=100))
df
# Country Year Var
# 1 Yugoslavia 1989 95.989667
# 2 Yugoslavia 1991 13.356852
# 3 Yugoslavia 1992 49.706498
# 4 USA 1990 20.008885
# 5 USA 1991 54.476561
# 6 USA 1993 9.806879
最终的数据集应该看起来像这样
final <- data.frame("Country" = c("Yugoslavia",1989,"Var" = c(95.989667,NA,13.356852,49.706498,20.008885,54.476561,9.806879))
final
# Country Year Var
# 1 Yugoslavia 1989 95.989667
# 2 Yugoslavia 1990 NA
# 3 Yugoslavia 1991 13.356852
# 4 Yugoslavia 1992 49.706498
# 5 USA 1989 NA
# 6 USA 1990 20.008885
# 7 USA 1991 54.476561
# 8 USA 1992 NA
# 9 USA 1993 9.806879
请注意,尽管在美国,所有缺失的值都被显示了出来(因为它仍然存在),但由于该州已不复存在,因此1993年南斯拉夫没有任何争端。
说明:我想有一个完整的小组来揭示所有缺失的观察结果以及所有相关的国家/地区年观察结果。 我能够构建一个nxt面板,其中N是国家总数,T是年总数。
问题是我不能做到这一点,因为像南斯拉夫这样的国家在该系列的某个时刻不复存在。就南斯拉夫而言,该州于1993年停止存在。类似地,在此系列的某个时候创建了塞尔维亚等其他州。我想避免遍历每个国家,因为我有数百个国家,而且很容易犯错,所以手动决定何时不存在。
因此,我正在寻找一种以国家/地区年的面板格式显示内置数据的程序包,这些数据仅在存在国家/地区时存在。有谁知道这是否存在?
创建一个完整的国家/地区年度专家组的任何其他建议将受到欢迎
最诚挚的问候