使用正则表达式抓取正文,但不包括特定条件

我正在使用Python正则表达式来获取已解析电子邮件的正文,该电子邮件可能不包含任何内容或可能看起来像这样:

  

一些连贯的句子。

     

lalskjfa; ljkd

     

其他东西

     
     

几行电子邮件签名等等

     

等等等等

     

我想要电子邮件正文中的所有内容,但不包括签名行开头符及其内容。

我基本上是要删除除签名电子邮件以外的所有内容,以便重新格式化以进行报告。

我尝试过:

  • 负前瞻:\G(\A\z|.*\n*(?!_))

  • 正向前瞻:\G(\A\z|.*\n*(?=_))

似乎都没有达到目的。

前瞻性不好,似乎抓住了一切。前瞻性地看,似乎什么也没抓住。

我希望获得的输出是以下文本:

  

一些连贯的句子。

     

lalskjfa; ljkd

     

其他东西

megeter 回答:使用正则表达式抓取正文,但不包括特定条件

您可以使用

(?s)\A.*?(?=\n_)

它匹配

  • (?s)-re.DOTALL内联标志
  • \A-字符串的开头
  • .*?-任意0个以上的字符,直到第一次出现时尽可能少
  • (?=\n_)-换行符,后跟_字符。
本文链接:https://www.f2er.com/3148765.html

大家都在问