gensim hdp模型中的所有主题都融合为一个主题

我在一个大型语料库(50GB的文本,1.6亿行)上训练了gensim hdp模型。结果是一组20个主题,所有主题几乎都相同,但词性略有不同。

我用于预处理输入文本的管道包括一些简单的方法,例如文本规范化停用词删除计算二元组 tf-idf ,并且忽略所有少于20个单词的句子

是否有使用hdp进行主题建模的直接方法或提供更准确结果的任何类似方法?

wawad1314 回答:gensim hdp模型中的所有主题都融合为一个主题

暂时没有好的解决方案,如果你有好的解决方案,请发邮件至:iooj@foxmail.com
本文链接:https://www.f2er.com/2725173.html

大家都在问