我正在使用PyLDAvis可视化Mallet的LDA结果。
在我可以这样做之前,我需要gensim库的包装器:
model = gensim.models.wrappers.ldamallet.malletmodel2ldamodel(model_list[8])
当我打印找到的主题时,它们的排序从0到10。
但是,当我使用pyLDAvis可视化主题时,主题顺序(0-10)与打印的主题不一致。
示例:
(5,'0.042*"euro" + 0.030*"smartpho" + 0.022*"camera" + 0.020*"display" + '
'0.018*"model" + 0.016*"picture" + 0.012*"price" + 0.010*"android"')
如您所见,该主题与智能手机有关。
但是,当我使用pyLDAvis可视化模型时,主题5与智能手机无关,而与另一个主题(例如汽车)有关。智能手机主题不再是5,而是主题1。
示例1:
这是已知错误还是正常现象? 有人可以帮忙吗?