是否有一个内置命令来执行此操作,或者有任何人对运行它的脚本有任何好运?
我想知道有多少记录(由特定的EOL定义,如“^%!”)有多少次出现的特定字符. (按出现次数降序排序)
例如,使用此示例文件:
jdk,|ljn^%!dk,|sn,|fgc^%! ydfsvuyx^%!67ds5,|bvujhy,|s6d75 djh,|sudh^%!nhjf,|^%!fdiu^%!
建议输入:将EOL和文件名分隔符作为参数.
bash/perl some_script_name ",|" "^%!" samplefile
期望的输出:
occs count 3 1 2 1 1 2 0 2
这是因为第1记录有一个分隔符,第2记录有2,第3记录有0,第4记录有3,第5记录有1,第6记录有0.
如果您可以使分隔符和EOL参数接受十六进制输入(即2C7C)或正常字符输入(即|),则可以使用奖励.
解决方法
这就是perl的生活:
#!perl -w use 5.12.0; my ($delim,$eol,$file) = @ARGV; open my $fh,"<$file" or die "error opening $file $!"; $/ = $eol; # input record separator my %counts; while (<$fh>) { my $matches = () = $_ =~ /(\Q$delim\E)/g; # "goatse" operator $counts{$matches}++; } say "occs\tcount"; foreach my $num (reverse sort keys %counts) { say "$num\t$counts{$num}"; }
(如果你没有5.12,删除“使用5.12”行并用print替换say)