正则表达式替换html标签外的文本

前端之家收集整理的这篇文章主要介绍了正则表达式替换html标签外的文本前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我有这个 HTML
  1. "This is simple html text <span class='simple'>simple simple text text</span> text"

我只需要匹配任何HTML标签之外的单词.我的意思是,如果我想匹配“简单”和“文本”,我应该只从“这是简单的HTML文本”和最后一部分“文本”获得结果 – 结果将是“简单”1匹配,“文本”2火柴.有人可以帮我吗我正在使用jQuery.

  1. var pattern = new RegExp("(\\b" + value + "\\b)",'gi');
  2.  
  3. if (pattern.test(text)) {
  4. text = text.replace(pattern,"<span class='notranslate'>$1</span>");
  5. }

值是我想要匹配的单词(在这种情况下是“简单”)
>文本是“这是简单的html文本< span class ='simple'>简单的简单文本文本< / span>文本”

我需要使用< span>包装所有选定的单词(在本例中为“简单”).但是我想只包含任何HTML标签之外的单词.这个例子的结果应该是

  1. This is <span class='notranslate'>simple</span> html <span class='notranslate'>text</span> <span class='simple'>simple simple text text</span> <span class='notranslate'>text</span>

我不想替换里面的任何文本

  1. <span class='simple'>simple simple text text</span>

它应该与更换前相同.

好的,尝试使用这个正则表达式:
  1. (text|simple)(?![^<]*>|[^<>]*</)

Example worked on regex101.

分解:

  1. ( # Open capture group
  2. text # Match 'text'
  3. | # Or
  4. simple # Match 'simple'
  5. ) # End capture group
  6. (?! # Negative lookahead start (will cause match to fail if contents match)
  7. [^<]* # Any number of non-'<' characters
  8. > # A > character
  9. | # Or
  10. [^<>]* # Any number of non-'<' and non-'>' characters
  11. </ # The characters < and /
  12. ) # End negative lookahead.

如果文本或简单在html标签之间,负面的前瞻将阻止匹配.

猜你在找的正则表达式相关文章