^(.*)(\r?\n\1)+$
替换为\1
以上是使用REGEX删除重复行的好方法 但它要求整行都是重复的
但是–如果我想检测并消除重复-当整行不是一个重复-而是前X个字符时,我将使用什么
示例: 原始文件
12345 Dennis Yancey University of Miami
12345 Dennis Yancey University of Milan
12345 Dennis Yancey University of Rome
12344 Ryan Gardner University of Spain
12347 Smith John University of Canada
已删除重复项
12345 Dennis Yancey University of Miami
12344 Ryan Gardner University of Spain
12347 Smith John University of Canada