我有一个文本文件chunk_names.txt
,如下所示:
chr1_12334_64321
chr1_134435_77474
chr10_463252_74754
chr10_54265_423435
chr13_5464565_547644567
这是一个示例,但所有染色体均被表示(1 ... 22,X和Y)。所有条目均采用相同的格式chr{1..22,X or Y}_*string of numbers*__*string of numbers*
。
我想将它们分成每个染色体文件,例如将所有从chr10开始的块放入一个名为chr10.txt
的文件中:
在Linux中,我尝试过:
for i in {1..22}
do
grep chr$i chunk_names.txt > chr$i.txt
done
但是,chr1.txt
输出文件现在包含其中所有带有1(1、10、11、12等)的所有染色体块。
我将如何修改此脚本以分离出染色体?
我还没有解决如何在同一脚本中包含X或Y染色体的问题,目前正在单独运行
我尝试过的事情:
grep -o gives me just "chr$i" as an output
grep 'chr$i' gives me blank files
grep "chr$i" has the initial problem
非常感谢您的宝贵时间。