在Python中从RTF文件中提取表数据

我需要从RTF文件中提取表数据,但是我似乎对此没有任何解决方案。谁能建议一个解决方案,或者以前曾经这样做过并且愿意告诉我dawae?我目前正在探索将我定义为表格的开始和结束的位置改为抑扬音符号。

我只派生表的开始,类似于

\par \ltrrow}

但在表格末尾,我似乎找不到合适的语法...。

先谢谢了。 :)

gswgyh727 回答:在Python中从RTF文件中提取表数据

这里是使用正则表达式将rtf格式转换为纯文本的示例

import re

text = r"{\rtf1\ansi\ansicpg1252\deff0\deflang1033{\fonttbl{\f0\fnil\fcharset0 MS Shell Dlg 2;}{\f1\fnil MS Shell Dlg 2;}} {\colortbl ;\red0\green0\blue0;} {\*\generator Msftedit 5.41.15.1507;}\viewkind4\uc1\pard\tx720\cf1\f0\fs20 can u send me info for the call plsssss\f1\par }"

x = re.sub(r"{\*?\\.+(;})|\s?\\[A-Za-z0-9]+|\s?{\s?\\[A-Za-z0-9]+\s?|\s?}\s?","",text)
print(x)
本文链接:https://www.f2er.com/2774433.html

大家都在问