正则表达式 – 在unix / linux上的grep:如何替换或捕获文本?

前端之家收集整理的这篇文章主要介绍了正则表达式 – 在unix / linux上的grep:如何替换或捕获文本?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。

所以我对正则表达式非常好,但是我在unix上遇到了一些问题.以下是我想知道如何做的两件事:

1)替换除字母,数字和下划线之外的所有文本

PHP中我会这样做:(效果很好)

  1. preg_replace('#[^a-zA-Z0-9_]#','',$text).

在bash中我试过这个(成效有限);好像它不允许你使用全套正则表达式:

  1. text="my #1 example!"
  2. ${text/[^a-zA-Z0-9_]/'')

我用sed尝试了它,但它似乎仍然有完整的正则表达集的问题:

  1. echo "my #1 example!" | sed s/[^a-zA-Z0-9\_]//

我确定有一种方法可以用grep来做,但是当我尝试时它将它分成多行:

  1. echo abc\!\@\#\$\%\^\&\*\(222 | grep -Eos '[a-zA-Z0-9\_]+'

最后我也尝试使用expr,但似乎对扩展正则表达式的支持非常有限……

2)捕获(多个)文本部分

PHP中我可以做这样的事情:

  1. preg_match('#(word1).*(word2)#',$text,$matches);

我不确定在* nix中怎么可能……

最佳答案
第1部分

你几乎就在那里,sed只需添加g修饰符,以便替换发生在全球,没有g,替换只会发生一次.

  1. $echo "my #1 example!" | sed s/[^a-zA-Z0-9\_]//g
  2. my1example
  3. $

您的bash模式替换也犯了同样的错误:不全局替换:

  1. $text="my #1 example!"
  2. # non-global replacement. Only the space is delete.
  3. $echo ${text/[^a-zA-Z0-9_]/''}
  4. my#1 example!
  5. # global replacement by adding an additional /
  6. $echo ${text//[^a-zA-Z0-9_]/''}
  7. my1example

第2部分

捕获在sed中的工作方式与在PHP的正则表达式中相同:将模式括在括号中捕获:

  1. # swap foo and bar's number using capturing and back reference.
  2. $echo 'foo1 bar2' | sed -r 's/foo([0-9]+) bar([0-9]+)/foo\2 bar\1/'
  3. foo2 bar1
  4. $

猜你在找的Linux相关文章