topic-modeling

使用Mallet进行主题建模-主题键输出参数

我对此处提出的问题有一个后续问题：<a href="https://stackoverflow.com/questions/45162186/mallet-topic-modeling-topic-keys

前端之家
2022-08-05 • 问答
在Gensim中的每个句子中找到主要主题时键入错误

我正在使用gensim（在jupyter笔记本中）进行主题建模。我成功创建了一个模型并将其可视化。下面是代码

前端之家
2022-08-05 • 问答
有没有办法比较两个无监督模型？

我了解通常很难评估无人监督的模型。但是，由于我是NLP的新手，所以我想问一下是否可以比较两种主

前端之家
2022-08-02 • 问答
输入矩阵的每一行都必须包含至少一个非零条目

我在运行这段代码时遇到了这个问题 <pre><code>text_lda <- LDA(text_dtm, k = 2, method = "VEM", control = NU

前端之家
2022-07-28 • 问答
我需要将R Shiny的进度条添加到手工主题建模功能

我正在尝试在R Shiny App中应用下面的主题建模功能，并在R处于其上时获取进度栏。我看到了一些我认为

前端之家
2022-07-26 • 问答
根据给定的单词概率，数千个主题和数百万条推文来计算主题频率

我有基本上像这样的Tweet数据 <pre><code>userID <- c("1","2","2") text <- c("cat dog"

前端之家
2022-07-25 • 问答
当您有很多主题时，是否将LDA性能标记为良好？

我在一些主题中有一堆已经分类的文档，每个主题都是审查某些文档的人员。目的是根据每个审阅者已

前端之家
2022-07-25 • 问答
gensim hdp模型中的所有主题都融合为一个主题

我在一个大型语料库（50GB的文本，1.6亿行）上训练了gensim hdp模型。结果是一组20个主题，所有主题几乎

前端之家
2022-07-25 • 问答
Watson SDK API的主题建模示例

我有一份将在不同时间在线上载的文档列表。我没有有关内容的任何先前信息，我也没有可以分配给文

前端之家
2022-07-25 • 问答
培训结束后如何使用Gensim LDA模型对主题进行分类记录（如何部署代码）？

我尝试为主题建模<a href="https://i.stack.imgur.com/lmnU6.png" rel="nofollow noreferrer">output of my trained model</a>建立gensi

前端之家
2022-07-23 • 问答
木槌输出主题权重0.0或1.0，中间不输出

因此使用槌的API <a href="http://mallet.cs.umass.edu/topics-devel.php" rel="nofollow noreferrer">following this example in the devel

前端之家
2022-07-22 • 问答
如何获得两个全文文档之间的相似性度量？

例如，假设我有三个文本文档（让3个随机生成的文本）。文档1： <blockquote> “每英里都在

前端之家
2022-07-22 • 问答
Mallet DMR对于基于特征的主题分布是否具有负面影响？

我已经创建了DMR主题模型（通过Java API），该模型根据文档的发布年份来计算主题分布。结果分

前端之家
2022-07-18 • 问答
词频对Gensim LDA主题建模有何影响

我正在尝试使用Gensim LDA建模来对食品食谱数据集进行主题建模。我希望以食谱中的关键成分为主题。但

前端之家
2022-07-18 • 问答
为什么Sklearn LDA主题模型总是建议（选择）主题最少的主题模型？

我正在对文本数据进行主题建模（大约4000条新闻文章）。为此，我正在使用Sklearn LDA模型。在执行此操

前端之家
2022-07-17 • 问答
如何计算潜在狄利克雷分配（LDA）分数

我想知道将文档与lda一起使用时的评分如何。例子 <pre><code>unseen_document = 'How a Pentagon deal became an

前端之家
2022-07-17 • 问答
在LDA中使用主题建模时如何处理不同的文档长度

我正在使用主题建模和LDA来实现句子相似性。语料库中的每个文档的长度从2个单词到15个单词不等。

前端之家
2022-07-16 • 问答
使用DMR跟踪主题相关性-解释困难

如我的<a href="https://stackoverflow.com/questions/60669679/mallet-dmr-negative-propability-for-feature-based-topic-distribution">prev

前端之家
2022-07-16 • 问答
为什么在潜在的Dirichlet分配中，困惑总是始终以最大的主题数来最好？

我已经使用Java Mallet API在37,500个文档上构建了潜在狄利克雷分配（LDA）模型。为了自动确定主题的“最

前端之家
2022-07-16 • 问答
主题建模-在sklearn中运行LDA：如何计算Wordcloud？

我在<strong> sklearn </strong>中训练了我的LDA模型以构建主题模型，但是不知道如何为每个获得的主题计算关

前端之家
2022-07-16 • 问答
在python 3中读取.AVRO文件

我有四个“ .AVRO”文件，这些文件是从道琼斯开发者平台（<a href="https://developer.dowjones.com" rel="nofollow nore

前端之家
2022-07-15 • 问答
如何使用LDA在列中的每个文档中获得每个主题的贡献？

<a href="https://i.stack.imgur.com/FCbCk.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/FCbCk.png" alt="enter image

前端之家
2022-07-15 • 问答
使用LDA进行主题建模-文档中不存在热门术语

我正在使用LDA在一组文档上使用Gensim程序包进行主题建模，经过培训，我得到的是该主题的热门术语，

前端之家
2022-07-15 • 问答
将相同的行值合并为数据帧中的一并计算值以总计一

这是我的数据的样子： head（数据，8） <pre><code>text count topic term beta text1 1 21

前端之家
2022-07-14 • 问答
tidytext入门的一些帮助

我有一个正在进行的项目是tidytext，这是我的新手。我的输入数据当前为文件夹中单个.txt文件的形式。

前端之家
2022-07-14 • 问答
LDA模型中的0.3的相干值

在评估LDA模型时，我对一致性得分的使用感到困惑。我在一个数据集上运行了LDA模型，获得了针

前端之家
2022-07-14 • 问答
如何在LDA模型中获取新文档的主题

如何在LDA模型中动态传递用户提供的<code>.txt</code>文档？我已经尝试了下面的代码，但是无法提供适当

前端之家
2022-07-14 • 问答
自动主题标签评估指标

我正在尝试在大型研究论文数据集上做主题标签问题。我的想法是，我可以给每篇论文一些相关标签。</

前端之家
2022-07-13 • 问答
主题建模和潜在狄利克雷分配（LDA）

我写了一个LDA python程序。在最后一步： <pre><code>for index, score in sorted(lda_model[bow_corpus], key=lambda tup: -1

前端之家
2022-07-13 • 问答
如何使用t-sne聚类图可视化NMF主题模型？

我正在做主题建模，并且使用了NMF（非负矩阵分解）主题模型。我已经使用pyLDAvis可视化模型，但是我也

前端之家
2022-07-11 • 问答