使用bash和grep -c对密码子进行排序和计数

我有一个文本文件,其中包含多行密码子 每行都有一组三个核苷酸序列,可以是A,T,G,C,但一行中只有三个。 (例如ATC) 现在,我想编写一个while循环,该循环可以读取这些行并对其进行计数,并为我提供输出的密码子及其在文件中出现的次数从高到低的次数。

您不能在此循环中使用awk,而只能使用grep和uniq。 谢谢

sp871783024 回答:使用bash和grep -c对密码子进行排序和计数

您可以结合使用grep(以过滤仅具有ATGC序列的行,对uniq进行排序和计数以计算不同行,然后进行额外排序以按从高到低的顺序排序

grep '^[ATGC]\+$' | sort | |  uniq -c | sort -k1nr

这将适用于合理大小的文件(确保

本文链接:https://www.f2er.com/3170133.html

大家都在问