nlp - 前端之家

如何使用gensim keyedvectors查找两个给定单词之间的连接单词？

使用gensim，我可以用以下代码来解决方程式“国王+女人-男人=女王”： <pre class="lang-py prettyprint-overri

前端之家
2022-08-16 • 问答
如何在阅读行中分割行并将其保存在其他列表中？

这是我的代码 <pre><code>with open('file.txt', 'r') as source: # Indentation polTerm = [line.strip().sp

前端之家
2022-08-16 • 问答
稀疏矩阵：索引超出范围

我想对一个大型语料库运行textrank（仅我的开发环境正在使用17K句子）因此，我使用了scipy <code>dok

前端之家
2022-08-16 • 问答
Pytorch BiLSTM POS标记问题：RuntimeError：input.size（-1）必须等于input_size。预期为6，得到12

我有一个nlp数据集，根据Pytorch官方教程，我将数据集更改为word_to_idx和tag_to_idx，例如： <pre><code>word_

前端之家
2022-08-16 • 问答
InvalidArgumentError：在图形中找不到在feed_devices或fetch_devices中指定的张量embedding_1_input：0

我正在进行文本汇总，但是通过运行此代码块 <pre><code>for iteration in range(500): print('Iteration',

前端之家
2022-08-16 • 问答
上下文敏感张量和词向量之间的区别

我目前正在使用spacy在python中工作，并且有不同的预训练模型，例如en_core_web_sm或en_core_web_md。其中一个

前端之家
2022-08-16 • 问答
在nlplab Brat注释工具中创建每个用户的工作区

是否可以将一个Brat服务器实例上的用户分开？我知道如何在config.py文件中创建新的用户帐户，但是似乎

前端之家
2022-08-16 • 问答
有什么方法可以将2个段落与wordnet中最同义词的段落进行比较？

当用同义词检查两个字符串之间的相似性时，它几乎可以给我们带来超过肯定的准确性。例如如

前端之家
2022-08-16 • 问答
我们如何使用python找到两个不同的n-gram之间的上下文相似性？

例如，假设我们有两个词“ great”和“ very good”，它们在上下文上彼此相似，但是它们是不同的n-gram（

前端之家
2022-08-16 • 问答
对于单词，在枚举（句子）中标记：TypeError：“ int”对象不可迭代

我正在使用孟加拉语进行POS标记但是这个错误显示当我写print（word + tag）时，没有数据进入标记的文件

前端之家
2022-08-16 • 问答
在法语中使用textblob或spacy进行更正拼写

我想纠正法文中拼写错误的单词，看来spacy是最准确，最快速的打包方法，但这很复杂，我尝试使用textb

前端之家
2022-08-16 • 问答
如何处理高度不平衡的Issue（Text）分类数据集？

数据集的大小：81256，班级：200，每个类别的范围从特定类别下的2757到特定类别下的低至10不等。如何

前端之家
2022-08-16 • 问答
对于tagdOutput中的句子：TypeError：“ NoneType”对象不可迭代

句子或标记语料库之间发生问题但我无法解决代码这是句子代码 <pre><code>def loadUntagged(fileName): te

前端之家
2022-08-16 • 问答
是否可以使用Google BERT对文档进行矢量化处理？

我想使用BERT将我的文档转换为矢量，每个文档一个矢量。可能吗？如何使用标准库或流行库进行编程？

前端之家
2022-08-16 • 问答
有没有一种方法可以正确标记（PoS标记）一起组成短语的单词？

我尝试了多种方法来正确标记构成短语的一堆单词（尤其是名词短语），但未能成功。例如：“ t

前端之家
2022-08-16 • 问答
如何从文本语料库构建PPMI矩阵？

我正在尝试使用SVD模型在Brown语料库上嵌入单词。为此，我想先生成一个单词-单词共现矩阵，然后转换

前端之家
2022-08-16 • 问答
多输出机器学习模型-Python

您好，我尝试过搜索此主题的每个人都没有找到一个好的答案，所以我希望有人可以帮助我。假设我正

前端之家
2022-08-16 • 问答
NerManager（来自nlp.js）错误地提取了诸如system（“ pre-trained”）实体之类的实体

我正在使用阈值为0.8的NerManager。我要在函数中添加一组非常具体的训练样本（注意：以下是示例代码，

前端之家
2022-08-16 • 问答
python中是否有任何方法可以自动更正单列excel文件的多行中的拼写错误？

我正在为一个大学项目进行情感分析。我有一个名为“ comments”的“ column”的excel文件，它具有“ 1000行

前端之家
2022-08-16 • 问答
如何在keras中使用Bert作为长文本分类中的段落编码器来实现网络？

我正在做一个长文本分类任务，该文档中的文档超过10000个单词，我计划使用Bert作为段落编码器，然后

前端之家
2022-08-16 • 问答
从头开始构建TF-IDF矢量化器

我正在尝试从头开始构建tf-idf矢量化器。我计算了tf和idf，但是在计算tf-idf时遇到了麻烦。这是代码：</p

前端之家
2022-08-16 • 问答
如何从python的数据框中提取句子并保持段落键？

我有一个数据框，其中包含如下1604段： <a href="https://i.stack.imgur.com/s97KL.jpg" rel="nofollow noreferrer"><im

前端之家
2022-08-16 • 问答
有没有办法将经过spacy训练的模型加载到gensim中？

我想获得类似单词的列表。由于Spacy没有对此的内置支持，因此我想将spacy模型转换为gensim word2vec并获取

前端之家
2022-08-16 • 问答
简单的keras密集模型在拟合时冻结

我正在与Keras学习NLP，并且正在阅读教程。代码如下： <pre><code>import tensorflow_datasets as tfds imdb, info = t

前端之家
2022-08-16 • 问答
在SpaCy中将实体替换为其标签

SpaCy是否总会用其标签替换SpaCy NER检测到的实体？例如： <strong>我在玩Apple Macbook时正在吃一个苹果。</s

前端之家
2022-08-16 • 问答
Python NLP-Sklearn-负号和正号标签的文本分类器，字母组合和双字相同

我正在尝试创建文本分类器，以确定摘要是否表示对护理研究项目的访问。我正在从具有两个字段的数

前端之家
2022-08-16 • 问答
我可以使用什么现成的工具编写调查注释代码

我想编写从网站提取的大量调查回复的代码，我想使用使用（自然语言处理）NLP进行文本分类和情感分

前端之家
2022-08-16 • 问答
如何为自定义换能器模型的序列分类设置自定义输入管道？

我想使用其中一个模型进行拥抱面提供的序列分类，似乎它们提供了一个称为 <code>glue_convert_examples_to_fea

前端之家
2022-08-16 • 问答
使用DialogFlow detectintent无法正常工作

i使用DialogFlow v2（并尝试使用v2Beta1），使用python中的SDK，但问题是detectIntent方法无法识别查询输入中的

前端之家
2022-08-16 • 问答
词汇SpaCy模型'en_core_web_sm'的大小

我试图在SpaCy小型模型中查看词汇量： <pre><code>model_name="en_core_web_sm" nlpp=spacy.load(model_name) len(

前端之家
2022-08-16 • 问答

首页

下一页
末页