有关在pdf文档python中突出显示文本的问题

我正在尝试编写一个python脚本,该脚本将自动执行以pdf格式查找文本并根据其高亮显示的过程

我正在使用python的pymupdf模块。它适用于一些pdf。但是,当使用目标pdf(绘制零件和属性表)时,会将输出另存为空白pdf,其中没有数据,并且有一些空白高亮显示。

import fitz

doc=fitz.open("c5.pdf")

page = doc[0]

text = "a"

text_instances = page.searchFor(text)

for inst in text_instances:
    highlight = page.addHighlightAnnot(inst)


doc.save("out.pdf",garbage=4,deflate=True,clean=True)
vasilyrni 回答:有关在pdf文档python中突出显示文本的问题

您的PDF可能包含出现的元素,例如文本,但还有其他元素。可能它们只是某种类型的图形或图像。 在这种情况下,文本搜索当然找不到任何东西。

请在我的PyMuPDF仓库中提交问题,并附上一些样本PDF,以便我对此进行调查。

本文链接:https://www.f2er.com/3141195.html

大家都在问