-
为什么data.table :: B [A]和plyr :: join(A,B)返回不同的结果?
我在R中有2个数据表 <pre><code>A <- data.table(a = 1:4, b = 12:15) B <- data.table(a = 2:3, b = 13:14) </code></pre> < -
滚动连接和与data.table的精确连接
我想对一个变量进行滚动连接,但要考虑对另一个变量的精确匹配。 我可以通过这种方式进行滚 -
根据另一个表中符合R阈值的数据合并行
我有一个二进制数据集,需要通过组合满足特定条件的行来进行修改。我的代码将我带到实际修改数据 -
在data.table中使用唯一,但要跟踪原始行(例如,唯一然后匹配)
我对这个美好社区的第一个问题: 我想知道是否有更有效的方法,但是使用了data.table: <pre><c -
使用点点点(...)表示从data.table对象的自定义函数返回的列
我想使用<code>...</code>来表示我想从<code>data.table</code>对象的自定义函数返回的变量。这是一个最小的可 -
用另一行的值替换NA,具体取决于特定国家/地区和年份
我有一个data.table,其中包含货币(例如美元),如下所示,该国家/地区在转换为EUR后具有NA。此外,我 -
如何更快地计算排列的“交叉连接”?
我有一个包含两列的data.table。<br/> “活动,小组” <br/> 最多可以有20行,或少至1行。<br/> 每个事件都被 -
如何根据组和变量名转换数据
如何从R下面的data.frame转到其他data.frame。我是dplyr / tidyr的新手,所以不知道确切使用什么功能,但是我 -
用数值减去行并忽略NA
我有几个包含约18列的数据帧。 50000行。每行条目代表一个特定站点(=列)上的度量,并且数据包含NA值 -
如何在R中按组依次标记类别? 数据
这是一个非常简单的问题,但是我有以下数据: <pre><code>> head(Session_numbers) ID Session 1 1 1_43392 2 -
对data.table的每一行进行回归
我有一个大数据集,其中有<code>K>1million</code>个cols的观测<code>2xN</code>。 <code>N</code>列为<code>X</code>-s, -
为什么汇总日期返回数字-R
我有一个几百万行的data.table,试图在日期字段上进行汇总。返回的结果是数字(而不是日期),我不知 -
如何按条件和组过滤我的data.table?
<h1>问题</h1> 我在data.table上工作,其中每一行都是医学观察。问题是我的数据中有一些错误,在进行分 -
使用dcast然后融化不会产生我以(data.table方法)开始的表
我有data.frame(对不起,看起来很难看): <pre><code>sample <- data.table( b001 = c(0, NA, 0, 0, NA, NA, 0, 0, NA -
获取与值匹配的data.table列的索引
<pre><code>DT = data.table( id = 1:5, a = c(0,1,0,2,5), b = c(1,0,2,4,4), c = c(1,2,0,0,5)) # id a b c # 1: -
R中带有data.table的条件滞后值列
我有一个<code>data.table</code>,看起来像这样: <pre><code>df seller_id buyer_id hs10 year mean_ln_c_hit 1: -
使用列名或列位置的向量选择data.table的列,而不使用“ with = F”
我需要选择<code>data.table</code>中带有列名或位置向量的特定列。 <pre><code>library(data.table) DT <- data.tab -
分组后如何计算一定条件下的数据
我有以下数据表。 <pre><code>dat <- read_csv( "name,cnt a,10 a,22 a,13 b,4 c,4 c,5 -
如何合并两个data.tables的列?
我有两个类型为data.table的表。我想将表合并为一个表。它们看起来像: DT1: <pre><code>1 A B C -
dplyr :: case_when当按组在同一列上
我以前几乎从未使用过<code>data.table</code>,但是从如此多的线程看来,这似乎是大数据帧的解决方案。 </ -
函数绑定不同列和行的数据框列表
我想创建一个函数,该函数合并具有不同列号的数据帧列表,并且行具有我想保留的不同名称。本质上 -
将未引用的函数参数传递给data.table中的i
我正在为我的同事创建一个函数,以轻松分析一些预先指定的数据集。我希望他们能够传递“ i”参数来 -
如何计算从几个连续列中选择最大范围值的变量
我有一个数据框<code>df</code>,它总结了不同深度(5米<code>T5</code>,15米<code>T15</code>,25米<code>T25</code>和3 -
如何使用R将整数向量有效折叠到序列的data.table中?
给出一个大向量。例如: <pre><code>set.seed(1) in_vec <- sample(1:10000, 5000, replace = F) </code></pre> 如何有 -
按data.table中最高与第二高的比率过滤
根据我的数据 <pre><code>library(dplyr) testVect <- structure(c("11.2.0.3.0", "12.89", "12.71"), .Na -
在Loop中基于不同的数据集进行过滤
我正在尝试基于循环中另一个数据集的值过滤数据。我有两个名为<code>x</code>和<code>mx_long2</code>的数据框 -
使用R从大型数据集中提取满足每个vendor_id多个条件的行
使用R编程。我有Vendor_id,Bank_account_no和Date超过300万的数据集。我想获取每个Bank_account_no更改的vendor_id的 -
在data.table
<code>by</code>子句可以是用于计算分组列的表达式列表。如果它包装在<code>eval(…)</code>中,则它也可以是 -
替代data.table中的plyr :: mapvalues
我正在寻找<code>plyr::mapvalues</code>中<code>data.table</code>的可读替代形式。 例如,在<code>plyr::mapvalues</ -
使用r中的data.table计算每行不包含某些行的加权平均值
我一直在尝试获取一列加权平均值,该列使用data.table为每行排除一些行。 在以下示例中,FIPS是ID