-
分数在主题建模中表示什么
根据本教程,我将gimsm用于LSA <a href="https://www.datacamp.com/community/tutorials/discovering-hidden-topics-python" rel="nofol -
搜索文本中的单词,而不考虑词尾变化:Python
我正在尝试在给定文本中搜索指定的单词列表。该代码非常简单。 <pre><code>1 2 3 -
收到Spacy错误:没有名为“ spacy.pipeline.pipes”的模块; “ spacy.pipeline”不是软件包
我正在尝试测试在另一台机器上运行的模型,但是当我尝试将其导入到笔记本中时,出现此错误: ModuleN -
在NLP中训练数据集后如何预测标签
我正在尝试对评论进行情感分析;数据集包含两个主要的列:第一个是具有用户评论的“评论”,第二 -
计算文本相似度的最佳方法是什么?
有一些方法可以检索文本之间的相似性,例如wup_similarity()cosine_similarity()等。我的目的是建立一个 -
如何使用python
我有一个文本文件,需要提取前五行中段落中出现的指定关键字。 我能够找到关键字,但不能从 -
找不到错误libtensorflow framework.so.1
我正在尝试在Google云上运行一个git repo。但是系统找不到库路径。 <pre><code>myname@cloudshell:~/text-to-text- -
Spacy NLP:适用于可能是动词的专有名词-根据输入顺序的歧义,并根据标点进行拆分
我正在使用spacy NLP。解析器始终无法正确确定模棱两可的标记的PROPN / NOUN / VERB状态,因为在大多数语言 -
如何使用Python库将段落拆分为行
我有一个段落,其中有一些空格和特殊字符,并带有“ .....”。 我想知道python中是否有任何函数 -
spaCy加载模型失败
我正在尝试加载spaCy模型<code>de_core_news_sm</code>,但没有成功。由于我们公司的警察似乎阻止了<code>python - -
如何使用西班牙语使用Stanford NLP词性标签?
我正在与Stanford CoreNLP合作,我对此表示怀疑。 我想确定每个单词的语法类别,并在命令行中使用以下命 -
如何解决“ TypeError:无法在类似字节的对象上使用字符串模式”
我正在尝试标记新闻文章,其中我从URL中提取了文本。但是,当我尝试使用send_tokenize时,似乎遇到了将 -
如何释放pyspark模型(JavaModel)占用的内存?
如上所述,我通过pyspark加载了经过训练的word2vec模型。 <pre><code>word2vec_model = Word2VecModel.load("saving -
如何在csv中的两个文本列之间找到相似性
我在一个具有4000条记录的csv文件中有两个文本列。我必须在两个文本列之间执行文本相似性。我该怎么办? -
要求将BDD测试用例与爬网的页面对象进行比较,并自动将bdd步骤映射到页面对象和页面
我正在Tensorflow之上创建一个基于Keras的神经网络。我的要求是获取以下2个数据集并进行比较 <ol> <li> -
如何训练Stanford NLP NER提取模型来跳过重复的单词?
我正在尝试使用<strong> .NET Framework </strong>和<strong> StanFord NER模型</strong>从文本中提取NER。 我有类似的 -
word2vec中的类似单词是否有波兰语实现?
我找到了GoogleNews-vectors-negative300.bin库,但仅适用于ENG单词,在word2vec中是否有针对类似单词的波兰语实 -
线性预处理文本中是否有正确的步骤?
我合并了两个不同的数据集,以使一列具有文本,另一列具有情感评分(二进制0、1) 我正在尝试 -
如何对包含数字和特殊字符的字符串进行词法化?
我需要对包含数字和字母数字字符的字符串进行脱字符处理。示例: <pre><code>'strawberries1234!@ apples -
用于Word2Vec模型测试的问题对(基本事实)数据集?
我正在寻找测试数据集来优化我的Word2Vec模型。我从gensim找到了一个不错的产品: gensim / test / test -
使用Pytorch
我正在使用Pytorch 1.3.0运行循环网络,其中输入是来自小概率语法(单次热编码)的单词,目标是输入之 -
从字符串NLP中删除英语“废话”单词(例如“ um”,“ uh”)的策略
是否有一个好的python库,专门包含某种常见的英语“扔掉单词”的字典,例如“ um”,“ uh”,我可以 -
如何有效地计算正交向量? (NLP)
这是我在这里的第一个问题,因此,如果我没有正确执行操作,对不起。 因此,我在计算正交矩 -
无法在python中加载HDF5
我正在关注本教程:<a href="https://github.com/fastai/fastai/tree/master/courses/dl2/imdb_scripts" rel="nofollow noreferrer">http -
拉普拉斯平滑与卦
我有一个带有拉普拉斯平滑的Trigram模型, 我的训练句子是<code>A cat sat on the mat. A fat cat sat on the mat. A rat -
Streamlit ValueError:系列的真值不明确。使用a.empty,a.bool(),a.item(),a.any()或a.all()
我正在尝试在Streamlit.io应用程序上拟合我的模型,但出现上述Value-Error。但这在Jupyter Notebook上不会给出 -
熊猫-包含注释(行)和单词作为列标题的数据帧如何获得频率计数?
我正在尝试在相对较大的数据帧上执行字频计数,但不知道哪种方法是最佳方法。 当前我的数据 -
在Spacy中创建和加载自定义管道
我需要在多页文档上运行NLP管道。文本分类器对前N个句子进行操作,并且基于文本分类器的输出,需要 -
工作描述句子的分类方法
我需要对n = 630个职位描述的<code>job_experience</code>部分中的各个句子进行分类/分类。我对提取工作经验和 -
在数据框中查找包含双字/三字组单词的行
此示例用于查找二元组: 给出: <pre><code>import pandas as pd data = [['tom', 10], ['jobs', 15]