Camelot 无法提取整个表 2024-06-02 • 问答 我使用 Camelot 从我使用 ocrmypdf(500dpi) 从扫描转换为可搜索的 PDF 中提取表格信息。 Camelot 似乎能够识别表格并提取表格内的大部分数据,但似乎无法提取下半部分。本质上,它看到了表格的上半部分,但似乎无法将文本与下半部分分开。 这是有问题的 PDF 中的表格: 但是当我使用 Camelot 的可视化调试方法时,我要求它向我展示它将提取的单词,它似乎将表格的底部识别为一个巨大的块 您可以在此处提供有关改进 Camelots“愿景”的任何指导。 iCMS 回答:Camelot 无法提取整个表 暂时没有好的解决方案,如果你有好的解决方案,请发邮件至:iooj@foxmail.com ocrmypdfpdf-extractionpdftablespython-camelot 本文链接:https://www.f2er.com/190616.html 大家都在问 已解答将 Python 程序转换为 C/C++ 代码?2023-03-20 已解答模块化算法和 NTT(有限域 DFT)优化2023-03-20 已解答初始化是否需要左值到右值的转换?是`int x = x;` UB 吗?2023-03-20 已解答cout<<调用它打印的函数的顺序?2023-03-20 已解答C++11 中 COW std::string 实现的合法性2023-03-20 已解答为什么我不能将 unique_ptr 推回到向量中?2023-03-20 已解答std::vector::resize() 与 std::vector::reserve()2023-03-20 已解答extern inline 有什么作用?2023-03-20 已解答在这种特定情况下,使用成员初始值设定项列表和在构造函数中赋值之间有区别吗?2023-03-20 已解答为什么模数除法 (%) 仅适用于整数?2023-03-20 已解答在 C++ 中测量函数的执行时间2023-03-20 已解答如何使用 Code::Blocks 链接到库?2023-03-20 已解答C++ 中的 int 和 long 有什么区别?2023-03-20 已解答如何将cin和cout重定向到文件?2023-03-20 已解答优化掉一个“while(1);"在 C++0x2023-03-20 已解答如何在只有受保护或私有构造函数的类上调用 ::std::make_shared?2023-03-20