这是我的查询,因为我还没有找到合适的答案。 我有一个数据集,描述了13年跨丹麦城市之间流动人口总数的所有组合。
我想要的是一年中所有市政组合之间的移动总和。
请参见下面的代码:
library("tidyverse")
library("statsDK")
# GETTING DATA FROM DANISH ARCHIVES
fly66_0 <- retrieve_data("FLY66",ALDER = "0")
fly66_1 <- retrieve_data("FLY66",ALDER = "1")
fly66_2 <- retrieve_data("FLY66",ALDER = "2")
fly66_3 <- retrieve_data("FLY66",ALDER = "3")
fly66_4 <- retrieve_data("FLY66",ALDER = "4")
fly66_5 <- retrieve_data("FLY66",ALDER = "5")
fly_66 <- rbind(fly66_0,fly66_1,fly66_2,fly66_3,fly66_4,fly66_5)
fly_66 <- fly_66 %>%
group_by(TO_muni,FROM_muni,YEAR) %>%
summarise(Number = sum(Number))
这将产生下表(我将列名更改为英语):
# A tibble: 6 x 4
# Groups: TILKOMMUNE,FRAKOMMUNE [3]
TO_muni FROM_muni YEAR Number
<chr> <chr> <dbl> <dbl>
1 101 202 2006 1
2 101 202 2007 3
3 202 101 2006 2
4 202 101 2007 3
5 101 303 2006 2
6 303 101 2007 1
但是我想要的是:
# A tibble: 6 x 4
# Groups: TILKOMMUNE,FRAKOMMUNE [3]
TO_muni FROM_muni YEAR Number
<chr> <chr> <dbl> <dbl>
1 101 202 2006 -1
2 101 202 2007 0
3 202 101 2006 1
4 202 101 2007 0
5 101 303 2006 2
6 303 101 2006 -2
5 101 303 2007 -1
6 303 101 2007 1
我已经尝试了以下方法,但是我对它的理解不多:
library("reshape2")
fly_66 <- fly_66 %>%
dcast(TO_muni + YEAR ~ FROM_muni,value.var = "YEAR",fill = 0)
希望这是有道理的,并预先感谢。