-
如何使用gensim keyedvectors查找两个给定单词之间的连接单词?
使用gensim,我可以用以下代码来解决方程式“国王+女人-男人=女王”: <pre class="lang-py prettyprint-overri -
如何在阅读行中分割行并将其保存在其他列表中?
这是我的代码 <pre><code>with open('file.txt', 'r') as source: # Indentation polTerm = [line.strip().sp -
稀疏矩阵:索引超出范围
我想对一个大型语料库运行textrank(仅我的开发环境正在使用17K句子) 因此,我使用了scipy <code>dok -
Pytorch BiLSTM POS标记问题:RuntimeError:input.size(-1)必须等于input_size。预期为6,得到12
我有一个nlp数据集,根据Pytorch官方教程,我将数据集更改为word_to_idx和tag_to_idx,例如: <pre><code>word_ -
InvalidArgumentError:在图形中找不到在feed_devices或fetch_devices中指定的张量embedding_1_input:0
我正在进行文本汇总,但是通过运行此代码块 <pre><code>for iteration in range(500): print('Iteration', -
上下文敏感张量和词向量之间的区别
我目前正在使用spacy在python中工作,并且有不同的预训练模型,例如en_core_web_sm或en_core_web_md。其中一个 -
在nlplab Brat注释工具中创建每个用户的工作区
是否可以将一个Brat服务器实例上的用户分开?我知道如何在config.py文件中创建新的用户帐户,但是似乎 -
有什么方法可以将2个段落与wordnet中最同义词的段落进行比较?
当用同义词检查两个字符串之间的相似性时,它几乎可以给我们带来超过肯定的准确性。例如 如 -
我们如何使用python找到两个不同的n-gram之间的上下文相似性?
例如, 假设我们有两个词“ great”和“ very good”,它们在上下文上彼此相似,但是它们是不同的n-gram( -
对于单词,在枚举(句子)中标记:TypeError:“ int”对象不可迭代
我正在使用孟加拉语进行POS标记 但是这个错误显示 当我写print(word + tag)时,没有数据进入标记的文件 -
在法语中使用textblob或spacy进行更正拼写
我想纠正法文中拼写错误的单词,看来spacy是最准确,最快速的打包方法,但这很复杂, 我尝试使用textb -
如何处理高度不平衡的Issue(Text)分类数据集?
数据集的大小:81256, 班级:200, 每个类别的范围从特定类别下的2757到特定类别下的低至10不等。 如何 -
对于tagdOutput中的句子:TypeError:“ NoneType”对象不可迭代
句子或标记语料库之间发生问题 但我无法解决代码 这是句子代码 <pre><code>def loadUntagged(fileName): te -
是否可以使用Google BERT对文档进行矢量化处理?
我想使用BERT将我的文档转换为矢量,每个文档一个矢量。可能吗?如何使用标准库或流行库进行编程? -
有没有一种方法可以正确标记(PoS标记)一起组成短语的单词?
我尝试了多种方法来正确标记构成短语的一堆单词(尤其是名词短语),但未能成功。 例如:“ t -
如何从文本语料库构建PPMI矩阵?
我正在尝试使用SVD模型在Brown语料库上嵌入单词。为此,我想先生成一个单词-单词共现矩阵,然后转换 -
多输出机器学习模型-Python
您好,我尝试过搜索此主题的每个人都没有找到一个好的答案,所以我希望有人可以帮助我。 假设我正 -
NerManager(来自nlp.js)错误地提取了诸如system(“ pre-trained”)实体之类的实体
我正在使用阈值为0.8的NerManager。我要在函数中添加一组非常具体的训练样本(注意:以下是示例代码, -
python中是否有任何方法可以自动更正单列excel文件的多行中的拼写错误?
我正在为一个大学项目进行情感分析。我有一个名为“ comments”的“ column”的excel文件,它具有“ 1000行 -
如何在keras中使用Bert作为长文本分类中的段落编码器来实现网络?
我正在做一个长文本分类任务,该文档中的文档超过10000个单词,我计划使用Bert作为段落编码器,然后 -
从头开始构建TF-IDF矢量化器
我正在尝试从头开始构建tf-idf矢量化器。我计算了tf和idf,但是在计算tf-idf时遇到了麻烦。这是代码:</p -
如何从python的数据框中提取句子并保持段落键?
我有一个数据框,其中包含如下1604段: <a href="https://i.stack.imgur.com/s97KL.jpg" rel="nofollow noreferrer"><im -
有没有办法将经过spacy训练的模型加载到gensim中?
我想获得类似单词的列表。由于Spacy没有对此的内置支持,因此我想将spacy模型转换为gensim word2vec并获取 -
简单的keras密集模型在拟合时冻结
我正在与Keras学习NLP,并且正在阅读教程。代码如下: <pre><code>import tensorflow_datasets as tfds imdb, info = t -
在SpaCy中将实体替换为其标签
SpaCy是否总会用其标签替换SpaCy NER检测到的实体? 例如: <strong>我在玩Apple Macbook时正在吃一个苹果。</s -
Python NLP-Sklearn-负号和正号标签的文本分类器,字母组合和双字相同
我正在尝试创建文本分类器,以确定摘要是否表示对护理研究项目的访问。我正在从具有两个字段的数 -
我可以使用什么现成的工具编写调查注释代码
我想编写从网站提取的大量调查回复的代码,我想使用使用(自然语言处理)NLP进行文本分类和情感分 -
如何为自定义换能器模型的序列分类设置自定义输入管道?
我想使用其中一个模型进行拥抱面提供的序列分类,似乎它们提供了一个称为 <code>glue_convert_examples_to_fea -
使用DialogFlow detectintent无法正常工作
i使用DialogFlow v2(并尝试使用v2Beta1),使用python中的SDK,但问题是detectIntent方法无法识别查询输入中的 -
词汇SpaCy模型'en_core_web_sm'的大小
我试图在SpaCy小型模型中查看词汇量: <pre><code>model_name="en_core_web_sm" nlpp=spacy.load(model_name) len(