-
在训练NER模型时添加Retokenize管道
我目前正在尝试训练围绕“属性描述”为中心的NER模型。我可以得到一个经过全面训练的模型,以实现 -
在Spacy中使用nlp.pipe()获取Dataframe列的doc对象
我正在使用Spacy nlp.pipe()获取pandas Dataframe列中文本数据的doc对象,但是代码中作为“文本”返回的已 -
为什么SpaCy在Pypi上不再具有版本<2.0.0的轮子?
我需要一个适用于SpaCy的轮子来解决我的构建问题。在哪里可以找到它?该文件名应该为<code>spacy-1.10.1-cp -
在“熊猫系列”和“数据框”中使用Spacy进行词素化问题
我正在使用Pandas和Spacy进行形状为(14640,16)的<a href="https://www.kaggle.com/crowdflower/twitter-airline-sentiment" rel=" -
使用PIP安装Spacy时出错-退出状态1
我正在尝试在Anaconda的Python 3.7.3提示符下安装SpaCy,并在下面出现错误。 我已经将pip(升级到19.3.1 -
使用人工智能识别文档类型的最佳方法是什么?
伙计们!我希望你一切都好。识别文档类型的最佳方法是什么?我想到的第一件事是将文档传递到OCR中 -
在Windows 10的pycharm虚拟环境中安装spacy库时发生错误
<pre><code> ERROR: Command errored out with exit status 1: command: 'f:\project\nlpprojects\<projectName>\tenv\scripts\python.e -
spaCy中的令牌和跨度(来自文档的切片)有什么区别?
我想知道<strong> spaCy </strong>中<strong>令牌</strong>和<strong> span </strong>有什么区别。 还有,当我们必 -
空间匹配者除了第一个之外无法识别模式
无法找到我的模式在哪里出错导致结果。 我想找到的句子:“#1 – 2015年1月31日”以及采用这种 -
如何识别具有相同含义的单词以减少数据集中的标签/类别/类的数量
这是我的数据集中的一列示例: <pre><code>"industries": ["Gaming", "fitness and wellness"] </cod -
Google Colab中的Spacy取代
我正在尝试在Google colab中运行展示服务器: <pre><code>from spacy import displacy frasesin=nlp("Yo quisiera saber -
在处理40万多个文档时,是否可以提高spaCy的内存使用率和运行时间?
我目前大约有40万多个文档,每个文档都有相关的组和ID号。它们平均大约24000个字符,每个字符350行。 -
将标准ner模型与自定义ner模型合并
我正在使用自定义数据训练用于命名实体识别的现有标准模型。训练了模型之后,它忘记了标准模型中 -
AttributeError:'English'对象没有属性'vocal'
我正在使用en_core_web_sm 2.2.5运行此代码 <pre><code>>>> import spacy >>> nlp = spacy.load('en_core_w -
使用SpaCy获取实体的左右单词
我一直在与SpaCy合作进行NLP项目,以获取所有实体的左右单词并将其转储为JSON格式。 这是我尝试 -
超过6个小时后,数据流作业失败,并显示“工作人员无法与服务联系”?
我正在使用<code>Dataflow</code>从<code>BigQuery</code>读取数据,然后使用python进行NLP预处理。我正在使用<code>Py -
使用Spacy进行NER训练
在空的NER模型上运行火车时,我应该只包含标记的数据(必须至少包含一个实体的数据),还是应该完 -
我想将引号中的单词提取为特定的NER
我想提取一些句子的特定信息。我找到了<a href="https://medium.com/@manivannan_data/how-to-train-ner-with-custom-training- -
如何获得spaCy以使用通用依赖项
Spacy的站点表示,他们在其注释规范页面中使用了通用依赖项方案。但是,当我解析“我爱你”时,“'y -
在不改变给定句子含义的情况下,从给定句子生成新句子
我想从给定的句子中生成与该给定句子相同的新句子。 <pre><code>from nltk.corpus import wordnet from nltk.tokeni -
spaCy:在GCloud上部署时,找不到模型“ en”
我已经训练了一些NLP模型,还完成了Flask应用程序,将模型包装到一个API中,供前端客户端调用。一切顺 -
如何降低Python3的认知复杂度
我对这段代码有疑问: <pre><code>doc = nlp(text) words = nlp(text).ents[0] for entity in doc.ents: self.entity_list = [e -
基于spacy基于规则的匹配是否可以将两个关键字之间最多匹配一定数量的通配符进行匹配?
例如,我试图匹配两个关键字,中间最多五个通配符。我可以添加五个具有不同通配符数量的模式,但 -
使用spaCy从动词标签中提取英语祈使语气
我想检测英语句子中动词的祈使语气。通过<a href="https://stackoverflow.com/questions/53755559/how-to-extract-tag-attribu -
偶尔,我如何确保始终将特定字符视为完整令牌?
为了方便起见,我希望像“€”,“ $”或“¥”这样的字符始终被视为令牌。但是,似乎有时它们已成 -
伪查询标点干扰
<a href="https://spacy.io/universe/project/spacy-lookup" rel="nofollow noreferrer">Spacy-lookup</a>是非常大的字典的实体匹配 -
使用spacy,如何确保字母序列永远不会拆分为标记
我正在寻找一种方法来确保序列<code>"#*"</code>出现在文本中的任何时间,spacy给了我令牌<code>"#*& -
实体识别类别
我正在尝试使用Python使用<strong> nltk </strong>或<strong> spaCy </strong>从<strong> NLP </strong>开始。 我的问 -
SpaCy:如何获取实体在整个文档中的位置?
我知道SpaCy在句子中提供每个实体的开始和结束。我想要整个文档中实体的开头(而不仅仅是句子)。 -
基于空令牌的匹配,令牌之间令牌数量为n个
我正在使用spacy来匹配某些文本中的特定表达(意大利语)。我的文字可能以多种形式出现,我正在尝试