topic-modeling

Pyspark主题建模任务失败；无法解释错误日志

以下几行代码。我将包含更多内容，但我怀疑该错误是由于我的环境而不是代码引起的。紧接着<a href="ht

前端之家
2022-08-16 • 问答
分数在主题建模中表示什么

根据本教程，我将gimsm用于LSA <a href="https://www.datacamp.com/community/tutorials/discovering-hidden-topics-python" rel="nofol

前端之家
2022-08-16 • 问答
Jenson-Shannon距离是否比余弦距离更好，以比较由LDA主题向量表示的文档之间的相似性/相异性？

我遇到了一种称为<a href="https://en.wikipedia.org/wiki/Jensen%E2%80%93Shannon_divergence" rel="nofollow noreferrer">Jensen-Shanno

前端之家
2022-08-15 • 问答
在邻接数据框中转换事件列表数据

我有一个df，其中每列代表一个事件，并且单元格中有个人，像这样： <pre><code>df=data.frame(topic1=c("

前端之家
2022-08-15 • 问答
工作描述句子的分类方法

我需要对n = 630个职位描述的<code>job_experience</code>部分中的各个句子进行分类/分类。我对提取工作经验和

前端之家
2022-08-15 • 问答
主题建模-使用每个文档的主题分布及其关联的分类，以在监督学习算法中使用

使用潜在Dirichlet分配（在gensim或sklearn中使用python），如何使用每个文档的主题分布及其相关分类（假设

前端之家
2022-08-15 • 问答
Linux群集上的结构化主题建模（STM软件包）失败

我正在尝试在Linux集群上使用<code>stm</code>包对超过130,000个文档的主体进行建模。在本地运行代码

前端之家
2022-08-14 • 问答
在R中使用STM预处理文本时删除标点符号的问题

我在使用<code>textProcessor</code>中的函数<code>:STM</code>删除数据框的标点符号时遇到了一些问题，我不知道

前端之家
2022-08-14 • 问答
从词袋向量使用gensim创建LDA模型

我想根据Jstor提供的数据（例如<a href="https://www.jstor.org/dfr/about/sample-datasets" rel="nofollow noreferrer">https://www.

前端之家
2022-08-14 • 问答
是否仅根据我的语料库或外部数据计算主题一致性（gensim CoherenceModel）？

我正在使用LDA对20世纪英语对应语料库进行建模，并且一直使用<strong>主题连贯性</strong>（以及轮廓分数

前端之家
2022-08-14 • 问答
在R中使用LDA按组进行主题建模

我陷入一个问题。我正在尝试使用LDA将句子归类为主题。我已经做到了，但是问题是：LDA正在处理整个

前端之家
2022-08-13 • 问答
makeTopMatrix中的结构主题建模（stm）错误（患病率，数据）

当我使用相同的stm教程代码时，我也遇到了与Ana相同的问题。 [<a href="https://github.com/dondealban/learning-stm][1

前端之家
2022-08-13 • 问答
使用预定主题分布初始化Gensim LDA模型

在确定新文档的主题时，我们可以使gensim lda模型使用预定主题分布吗？例如： <pre><code>import g

前端之家
2022-08-13 • 问答
计算一致性得分时出错– AttributeError：“ dict”对象没有属性“ id2token”

我是NLP的初学者，这是我第一次进行主题建模。我能够生成模型，但是无法生成一致性度量。将

前端之家
2022-08-13 • 问答
在主题建模中将Word2vec输出用作LDA的输入

我已经读到，用于主题建模（从文本中提取可能的主题）的最常用技术是潜在Dirichlet分配（LDA）。但是

前端之家
2022-08-12 • 问答
数据中按类别的主题建模

我想看看是否可以通过分类而不是整个数据集使用LDA通过主题建模来获取主题。 <strong>我的数据

前端之家
2022-08-12 • 问答
使用Java与Apache Spark从LDA模型获取主题词

我不熟悉使用Java使用Apache Spark进行文本挖掘。我正在尝试对文本数据进行LDA。首先，我使用IDF模型提取

前端之家
2022-08-12 • 问答
Amazon Sagemaker中用于主题建模的LDA和NTM有什么区别？

我正在寻找LDA和NTM之间的区别。在NTM上使用LDA有哪些用例？根据AWS文档： LDA：Amazon SageMaker

前端之家
2022-08-12 • 问答
随时间推移主题对STM的影响对STM的影响

我有一个表，其中包含以下列（变量）：doc_id，日，月，年，发言人，文本。我使用stm和Quanteda包找到

前端之家
2022-08-11 • 问答
使用LDA主题模型作为分类模型输入

我制作了LDA模型，以使用大量训练数据集制作主题模型。因此，我尝试使用此LDA模型对新句子进行分类

前端之家
2022-08-11 • 问答
如何解释主题一致性模型的结果？

我正在将gensims TopicCoherence模块用于我的文本数据，该模块可以提供以下结果： <a href="https://i.stack

前端之家
2022-08-10 • 问答
使用Java在Spark中将单词映射到术语索引

我正在尝试对文本数据进行LDA。首先，我使用IDF模型提取相关单词。然后，我创建一个LDA模型来获取我

前端之家
2022-08-10 • 问答
如何创建附加主题建模可视化？

我在<a href="https://www.kdnuggets.com/2018/08/topic-modeling-lsa-plsa-lda-lda2vec.html" rel="nofollow noreferrer">https://www.kdnugget

前端之家
2022-08-10 • 问答
基于LDA主题模型从字典中显示词频

我是R语言中的Text Mining的新手。我刚开始从事一个项目，该项目基于主题模型确定语料库中的词频，该

前端之家
2022-08-09 • 问答
PyLDAvis可视化与生成的主题不符

我正在使用PyLDAvis可视化Mallet的LDA结果。在我可以这样做之前，我需要gensim库的包装器： <pre>

前端之家
2022-08-09 • 问答
Python中的简单LDA2VEC实现

我想尝试lda2vec模型，但是我在文档中发现的信息很少，而且我在网上找到的所有代码示例都非常复杂。

前端之家
2022-08-08 • 问答
如何从现有文本集群中提取主题？

我对文本语料库进行了硬聚类（使用tf-idf权重），并获得了约200个聚类。如果我想获取每个群集的主题

前端之家
2022-08-08 • 问答
Python WindowsError：[错误123]文件名，目录名称或卷标签语法不正确

我从DARIAH项目网站获得了以下代码，以便在Python中进行主题建模。当我在命令外壳中运行脚本时，它开

前端之家
2022-08-08 • 问答
如何将令牌与字典键匹配并获得相应的值

我有一个带有如下标记的数据框，我想与字典的键匹配并获取相应的键和值。数据框： <pre><co

前端之家
2022-08-06 • 问答
在Python中按段落对书籍进行标记

我正在研究一个NLP项目，并试图按段落标记“大期望”，然后存储到列表中。我需要执行此操作以执行

前端之家
2022-08-06 • 问答

首页

下一页
末页