-
Pyspark主题建模任务失败;无法解释错误日志
以下几行代码。我将包含更多内容,但我怀疑该错误是由于我的环境而不是代码引起的。紧接着<a href="ht -
分数在主题建模中表示什么
根据本教程,我将gimsm用于LSA <a href="https://www.datacamp.com/community/tutorials/discovering-hidden-topics-python" rel="nofol -
Jenson-Shannon距离是否比余弦距离更好,以比较由LDA主题向量表示的文档之间的相似性/相异性?
我遇到了一种称为<a href="https://en.wikipedia.org/wiki/Jensen%E2%80%93Shannon_divergence" rel="nofollow noreferrer">Jensen-Shanno -
在邻接数据框中转换事件列表数据
我有一个df,其中每列代表一个事件,并且单元格中有个人,像这样: <pre><code>df=data.frame(topic1=c(" -
工作描述句子的分类方法
我需要对n = 630个职位描述的<code>job_experience</code>部分中的各个句子进行分类/分类。我对提取工作经验和 -
主题建模-使用每个文档的主题分布及其关联的分类,以在监督学习算法中使用
使用潜在Dirichlet分配(在gensim或sklearn中使用python),如何使用每个文档的主题分布及其相关分类(假设 -
Linux群集上的结构化主题建模(STM软件包)失败
我正在尝试在Linux集群上使用<code>stm</code>包对超过130,000个文档的主体进行建模。 在本地运行代码 -
在R中使用STM预处理文本时删除标点符号的问题
我在使用<code>textProcessor</code>中的函数<code>:STM</code>删除数据框的标点符号时遇到了一些问题,我不知道 -
从词袋向量使用gensim创建LDA模型
我想根据Jstor提供的数据(例如<a href="https://www.jstor.org/dfr/about/sample-datasets" rel="nofollow noreferrer">https://www. -
是否仅根据我的语料库或外部数据计算主题一致性(gensim CoherenceModel)?
我正在使用LDA对20世纪英语对应语料库进行建模,并且一直使用<strong>主题连贯性</strong>(以及轮廓分数 -
在R中使用LDA按组进行主题建模
我陷入一个问题。我正在尝试使用LDA将句子归类为主题。我已经做到了,但是问题是:LDA正在处理整个 -
makeTopMatrix中的结构主题建模(stm)错误(患病率,数据)
当我使用相同的stm教程代码时,我也遇到了与Ana相同的问题。 [<a href="https://github.com/dondealban/learning-stm][1 -
使用预定主题分布初始化Gensim LDA模型
在确定新文档的主题时,我们可以使gensim lda模型使用预定主题分布吗? 例如: <pre><code>import g -
计算一致性得分时出错– AttributeError:“ dict”对象没有属性“ id2token”
我是NLP的初学者,这是我第一次进行主题建模。我能够生成模型,但是无法生成一致性度量。 将 -
在主题建模中将Word2vec输出用作LDA的输入
我已经读到,用于主题建模(从文本中提取可能的主题)的最常用技术是潜在Dirichlet分配(LDA)。但是 -
数据中按类别的主题建模
我想看看是否可以通过分类而不是整个数据集使用LDA通过主题建模来获取主题。 <strong>我的数据 -
使用Java与Apache Spark从LDA模型获取主题词
我不熟悉使用Java使用Apache Spark进行文本挖掘。我正在尝试对文本数据进行LDA。 首先,我使用IDF模型提取 -
Amazon Sagemaker中用于主题建模的LDA和NTM有什么区别?
我正在寻找LDA和NTM之间的区别。在NTM上使用LDA有哪些用例? 根据AWS文档: LDA:Amazon SageMaker -
随时间推移主题对STM的影响对STM的影响
我有一个表,其中包含以下列(变量):doc_id,日,月,年,发言人,文本。 我使用stm和Quanteda包找到 -
使用LDA主题模型作为分类模型输入
我制作了LDA模型,以使用大量训练数据集制作主题模型。因此,我尝试使用此LDA模型对新句子进行分类 -
如何解释主题一致性模型的结果?
我正在将gensims TopicCoherence模块用于我的文本数据,该模块可以提供以下结果: <a href="https://i.stack -
使用Java在Spark中将单词映射到术语索引
我正在尝试对文本数据进行LDA。首先,我使用IDF模型提取相关单词。然后,我创建一个LDA模型来获取我 -
如何创建附加主题建模可视化?
我在<a href="https://www.kdnuggets.com/2018/08/topic-modeling-lsa-plsa-lda-lda2vec.html" rel="nofollow noreferrer">https://www.kdnugget -
基于LDA主题模型从字典中显示词频
我是R语言中的Text Mining的新手。我刚开始从事一个项目,该项目基于主题模型确定语料库中的词频,该 -
PyLDAvis可视化与生成的主题不符
我正在使用PyLDAvis可视化Mallet的LDA结果。 在我可以这样做之前,我需要gensim库的包装器: <pre> -
Python中的简单LDA2VEC实现
我想尝试lda2vec模型,但是我在文档中发现的信息很少,而且我在网上找到的所有代码示例都非常复杂。 -
如何从现有文本集群中提取主题?
我对文本语料库进行了硬聚类(使用tf-idf权重),并获得了约200个聚类。如果我想获取每个群集的主题 -
Python WindowsError:[错误123]文件名,目录名称或卷标签语法不正确
我从DARIAH项目网站获得了以下代码,以便在Python中进行主题建模。当我在命令外壳中运行脚本时,它开 -
如何将令牌与字典键匹配并获得相应的值
我有一个带有如下标记的数据框,我想与字典的键匹配并获取相应的键和值。 数据框: <pre><co -
在Python中按段落对书籍进行标记
我正在研究一个NLP项目,并试图按段落标记“大期望”,然后存储到列表中。我需要执行此操作以执行