转换源数据的最佳方法?

在R中工作。但是我认为这个问题是普遍的。

《华尔街日报》 可视化了有关美国疾病感染率的数据集:

转换源数据的最佳方法?

X轴为年份。 Y轴是状态。

每块红色阴影表示当年记录的该特定州的感染率强度。

要可视化的源数据集安排如下:

转换源数据的最佳方法?

数据集中的每一行对应于给定年份中单个国家的单个感染率。因此,可视化中的每个红色方块对应于数据集中的一行。

但是,如果数据集看起来像这样怎么办?:

转换源数据的最佳方法?

现在,每一行对应一个状态。每个州/行都有多种感染率,每年记录一次。这可能与现实世界中捕获数据的方式相匹配,因为您可以每年(每天)(对于冠状病毒)跟踪感染率,只需添加一个新列(而不是50个新行)即可。

问题在于,虽然这种布局更人性化,但对R的友好程度却不高。我们可以根据源数据集的排列轻松创建切片可视化,其中数据按感染率排列,但如果按状态排列则不太容易。

因此,最后,我的问题是—在Excel中是否有一种简单的方法将数据从第二种布局转换为第一种布局?

dizihenmang1 回答:转换源数据的最佳方法?

您可以在免费的开放源代码OpenRefine工具中使用转置功能来准备数据文件,然后再将其加载到R中。

本文链接:https://www.f2er.com/2338625.html

大家都在问