apache opennlp在多种语言之间切换

请在DIRE中寻求帮助!我是编程和NLP的新手。 我正在尝试使用Java在Android中构建OCR和NLP应用。对于OCR,我正在使用GV;对于NLP,我正在使用OpenNLP。因此,我的应用程序应识别并提取3种不同语言的实体:俄语,英语,中文。

我训练了我的NER模型,但是我不确定如何在它们之间集成切换(例如,如果使用中文,则使用chi-ner-name.bin,如果使用俄语,则使用rus-ner-name.bin) 。如果英语代码为:

 try {
        in_token = assetManager.open("en-token.bin");

        TokenizerModel tokenmodel = new TokenizerModel(in_token);
        TokenizerME tokenizer = new TokenizerME(tokenmodel);
        String[] tokens = tokenizer.tokenize(nlp_text);

        in_gems = assetManager.open("en-ner-names.bin");

        TokenNameFinderModel model_name = new TokenNameFinderModel(in_gems);
        NameFinderME nameFinder_name = new NameFinderME(model_name);
        Span[] nameSpans1 = nameFinder_name.find(tokens);

        for (Span s : nameSpans1) {
            for (int index = s.getStart(); index < s.getEnd(); index++) {
                name_output.setText(tokens[index] + " ");
            }
        }
    } catch (Exception ex) {
        Log.e("NLP","message: " + ex.getMessage(),ex);
    }

我是否只重复其他语言模型的代码?应该有更短而有效的方法,不是吗? 另外,我不确定是否必须在训练有素的模型之上实现LanguageDetector API?

对于像我这样的新手,Apache OpenNLP文档不够说明。有人可以给我指导,还是可以指点教程或其他资源。谢谢!

wwasdffdsa 回答:apache opennlp在多种语言之间切换

暂时没有好的解决方案,如果你有好的解决方案,请发邮件至:iooj@foxmail.com
本文链接:https://www.f2er.com/2742417.html

大家都在问