我的目标是从大量的Word文档中按文档和每个文档中的段落捕获所有文本,并将其保存为txt格式。
我知道我必须抓捕:
(1)页眉和页脚文本使用如下代码:
doc.Sections(1).Footers(1).Range.Text
(2)文档正文(我打算按段落进行操作):
For Each p In doc.Paragraphs
txt = p.Range
Next
(3)各种文本框和形状中的文本:
Shapes(1).TextFrame.textrange.Text
是否还有可能包含文本的其他Word对象?有没有更好的方法可以实现我的目标?我考虑过将Word文档另存为文本,但是在此过程中丢失了文本框中包含的文本。
UPD。还有脚注和尾注要注意。还有吗?