我有一个像这样的大表(这只是原始表的摘录,它具有数千个函数(行)和许多示例(列,第一个除外)):
function M123Q OO987 LKJY11
phi 9 2 0
3R 74 71 65
GlcNAc 1 0 1
我需要像这样对它进行重新排序,添加两个额外的列(“ total_hits”列是“ hits”列中所有具有相同“ ID”的数字的总和,“ Percentage”是“ hits”的乘积/“ total_hits”):
ID function hits total_hits percentage
M123Q phi 9 84 0.107142857
M123Q 3R 74 84 0.880952381
M123Q GlcNAc 1 84 0.011904762
OO987 phi 2 73 0.02739726
OO987 3R 71 73 0.97260274
OO987 GlcNAc 0 73 0
LKJY11 phi 0 66 0
LKJY11 3R 65 66 0.984848485
LKJY11 GlcNAc 1 66 0.015151515
我目前正在使用R,因此,如果可能的话,我非常感谢R解决方案。
非常感谢。