有没有一种方法可以强制使用给定的编码进行内容提取

我正在使用/ update / extract请求处理程序将文档推送到solr中,但是某些编码为Windows-1255(阿拉伯文本)的文本文档无法正确提取,给出的文本不可读。

我在网上搜索了solr文档,却一无所获。如果可能的话,我需要将文件编码作为参数发送,以便让tika解析器了解它。

有没有办法做到这一点?

annalamiya 回答:有没有一种方法可以强制使用给定的编码进行内容提取

暂时没有好的解决方案,如果你有好的解决方案,请发邮件至:iooj@foxmail.com
本文链接:https://www.f2er.com/3144059.html

大家都在问