-
使用Mallet进行主题建模-主题键输出参数
我对此处提出的问题有一个后续问题:<a href="https://stackoverflow.com/questions/45162186/mallet-topic-modeling-topic-keys -
在Gensim中的每个句子中找到主要主题时键入错误
我正在使用gensim(在jupyter笔记本中)进行主题建模。我成功创建了一个模型并将其可视化。下面是代码 -
有没有办法比较两个无监督模型?
我了解通常很难评估无人监督的模型。但是,由于我是NLP的新手,所以我想问一下是否可以比较两种主 -
输入矩阵的每一行都必须包含至少一个非零条目
我在运行这段代码时遇到了这个问题 <pre><code>text_lda <- LDA(text_dtm, k = 2, method = "VEM", control = NU -
我需要将R Shiny的进度条添加到手工主题建模功能
我正在尝试在R Shiny App中应用下面的主题建模功能,并在R处于其上时获取进度栏。我看到了一些我认为 -
根据给定的单词概率,数千个主题和数百万条推文来计算主题频率
我有基本上像这样的Tweet数据 <pre><code>userID <- c("1","2","2") text <- c("cat dog" -
当您有很多主题时,是否将LDA性能标记为良好?
我在一些主题中有一堆已经分类的文档,每个主题都是审查某些文档的人员。目的是根据每个审阅者已 -
gensim hdp模型中的所有主题都融合为一个主题
我在一个大型语料库(50GB的文本,1.6亿行)上训练了gensim hdp模型。结果是一组20个主题,所有主题几乎 -
Watson SDK API的主题建模示例
我有一份将在不同时间在线上载的文档列表。我没有有关内容的任何先前信息,我也没有可以分配给文 -
培训结束后如何使用Gensim LDA模型对主题进行分类记录(如何部署代码)?
我尝试为主题建模<a href="https://i.stack.imgur.com/lmnU6.png" rel="nofollow noreferrer">output of my trained model</a>建立gensi -
木槌输出主题权重0.0或1.0,中间不输出
因此使用槌的API <a href="http://mallet.cs.umass.edu/topics-devel.php" rel="nofollow noreferrer">following this example in the devel -
如何获得两个全文文档之间的相似性度量?
例如,假设我有三个文本文档(让3个随机生成的文本)。 文档1: <blockquote> “每英里都在 -
Mallet DMR对于基于特征的主题分布是否具有负面影响?
我已经创建了DMR主题模型(通过Java API),该模型根据文档的发布年份来计算主题分布。 结果分 -
词频对Gensim LDA主题建模有何影响
我正在尝试使用Gensim LDA建模来对食品食谱数据集进行主题建模。我希望以食谱中的关键成分为主题。但 -
为什么Sklearn LDA主题模型总是建议(选择)主题最少的主题模型?
我正在对文本数据进行主题建模(大约4000条新闻文章)。为此,我正在使用Sklearn LDA模型。在执行此操 -
如何计算潜在狄利克雷分配(LDA)分数
我想知道将文档与lda一起使用时的评分如何。 例子 <pre><code>unseen_document = 'How a Pentagon deal became an -
在LDA中使用主题建模时如何处理不同的文档长度
我正在使用主题建模和LDA来实现句子相似性。语料库中的每个文档的长度从2个单词到15个单词不等。 -
使用DMR跟踪主题相关性-解释困难
如我的<a href="https://stackoverflow.com/questions/60669679/mallet-dmr-negative-propability-for-feature-based-topic-distribution">prev -
为什么在潜在的Dirichlet分配中,困惑总是始终以最大的主题数来最好?
我已经使用Java Mallet API在37,500个文档上构建了潜在狄利克雷分配(LDA)模型。为了自动确定主题的“最 -
主题建模-在sklearn中运行LDA:如何计算Wordcloud?
我在<strong> sklearn </strong>中训练了我的LDA模型以构建主题模型,但是不知道如何为每个获得的主题计算关 -
在python 3中读取.AVRO文件
我有四个“ .AVRO”文件,这些文件是从道琼斯开发者平台(<a href="https://developer.dowjones.com" rel="nofollow nore -
如何使用LDA在列中的每个文档中获得每个主题的贡献?
<a href="https://i.stack.imgur.com/FCbCk.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/FCbCk.png" alt="enter image -
使用LDA进行主题建模-文档中不存在热门术语
我正在使用LDA在一组文档上使用Gensim程序包进行主题建模,经过培训,我得到的是该主题的热门术语, -
将相同的行值合并为数据帧中的一并计算值以总计一
这是我的数据的样子: head(数据,8) <pre><code>text count topic term beta text1 1 21 -
tidytext入门的一些帮助
我有一个正在进行的项目是tidytext,这是我的新手。我的输入数据当前为文件夹中单个.txt文件的形式。 -
LDA模型中的0.3的相干值
在评估LDA模型时,我对一致性得分的使用感到困惑。 我在一个数据集上运行了LDA模型,获得了针 -
如何在LDA模型中获取新文档的主题
如何在LDA模型中动态传递用户提供的<code>.txt</code>文档? 我已经尝试了下面的代码,但是无法提供适当 -
自动主题标签评估指标
我正在尝试在大型研究论文数据集上做主题标签问题。我的想法是,我可以给每篇论文一些相关标签。</ -
主题建模和潜在狄利克雷分配(LDA)
我写了一个LDA python程序。在最后一步: <pre><code>for index, score in sorted(lda_model[bow_corpus], key=lambda tup: -1 -
如何使用t-sne聚类图可视化NMF主题模型?
我正在做主题建模,并且使用了NMF(非负矩阵分解)主题模型。我已经使用pyLDAvis可视化模型,但是我也