-
我无法从xml提取节点。 xml_find_all无法按预期工作
我的问题可能很简单,但是我在使用xml时遇到问题。我有一个代谢物清单和一个数据库,在这里可以以xm -
R查找网页API来抓取数据
我正在寻找使用R从网页抓取数据的方法。大多数时候,我会找到网页,然后使用XML2和rvest的组合来抓取 -
带循环的网页抓取
我正在尝试使用循环功能从网站上抓取一些文本,但是在选择向量列表中的下一项时,循环功能并没有 -
强制read_xml将字符串解释为文字XML
我一直在努力迫使<code>read_xml</code>函数(<code>xml2</code>包)将我的字符输入视为文字字符串。显然,如果 -
rvest / xml2的编码问题-xmlXPathTranslateFunction:无效的UTF8字符串
我使用<code>rvest</code>收到了我无法理解的编码错误: <blockquote> xpath_search中的错误(x $ node,x $ -
将数据框转换为XML
我正在尝试将数据框转换为xml。大约有60万条记录。我正在使用XML包: <pre><code>library(XML) con <- xmlO -
是否有更快的重写来处理丢失的XML属性?
我正在处理巨大的XML文件,例如75 GB或更多,我的意思是,任何小的开销都会变成很多分钟,即使不是几 -
如何下载HTML的源代码
我想下载HTML的源代码。我该怎么办? 我尝试使用软件包<code>read_html</code>中的<code>xml2</code>。但是 -
获取节点值和父属性
我有一个如下所示的XML文件: <pre><code>w:tblStyle</code></pre> 我想收集所有<code> <dataDscr> <var ID= -
从非表格HTML抓取特定数字(作为文本)无效
我正在尝试从HTML网站中提取特定编号。 以某种方式,我没有发现我的错误。 这是原始代码 -
无法使用RVest抓取页面项目
我正在使用R进行网页抓取,最近正在做一些练习。 我目前在当地的eBay列表中玩耍,在那里我可以抓取 -
如何在管道中使用xml_find_first? (没有适用于“ xml_find_first”的适用方法应用于“字符”类的对象)
我试图取消一项用于大学研究的法令,该代码用于旧版本的<code>rvest</code> <pre><code>library("rvest" -
open.connection(x,“ rb”)中的错误:带有read_html函数的HTTP错误404
使用xml2软件包中的<code>read_html</code>函数时出现以下错误: <pre><code>Error in open.connection(x, "rb") : -
如何将Markdown文件转换为R DataFrame
我有以下<code>markdown</code>文件(md3.md),我想使用XML转换作为中间步骤将其转换为<code>R dataframe</code>。 -
使用rvest,xml2和选择器小工具进行webscrapping会导致xml_missing <NA>
我正在尝试从以下网址中抓取信息: <a href="https://www.google.com/search?q=812-800%20H%20St%20NW" rel="nofollow n -
如何将此XML文件转换为“小标题”?
我想更改此XML文件 <a href="https://elections.interieur.gouv.fr/telechargements/MUNICIPALES2020/candidatureT1/001/C1001.xml" rel="n -
如何从网站获取表格(scrappin)
请让我将此网站中的表格放入Rstudio中: “ <a href="https://www.worldometers.info/coronavirus/#countries" rel="nofollow nor -
edgarWebR开始给出与xml2软件包有关的错误
此功能在2月中旬生效,但从昨天开始停止。看起来随后可能对xml2进行了一些更新,不确定是否是一个因 -
在tidyverse管道中同时获取xml_attrs和xml_text
我正在尝试使用tidyverse管道将XML转换为小标题。节点同时具有属性和文本。 输入: <pre><code>txt -
如何迭代到网站的最后一页并在.csv文件中逐行写入数据?
我正在尝试抓取一些确实有用的个人信息发布(以下代码),但是我目前必须走到最后一页才能找出其 -
当我尝试致电kableExtra时显示错误
库(kableExtra)出现下一个错误: <blockquote> 错误:get(Info [i,1],envir = env)中的'kableExtra'包或 -
如何在HTML表格中添加新行
我正在为Uni项目抓取历史狗比赛结果的数据。如何将带有来自其他表的元素的列添加到表?特别是它之 -
`xml2` R软件包未通过XInclude组装多个xml文档
我正在尝试读取一个XML文件,该文件使用XInclude从多个xml文件组装xml。例如如果我有两个名为“ parent.xml -
使用RVest获取文本时如何保持换行符
我正在从网站上提取法院判决书的文本,并希望保留换行符(稍后需要进行文本分析)。不幸的是,<code -
从XML子页面中抓取位置不同的项目
到目前为止,我没有从该页面上成功刮除“ Die Verlustursache”表 <pre><code>http://www.ubootarchiv.de/ubootwiki/in -
错误:软件包“ xml2”的编译失败
我正在Ubuntu 16.04中安装“ rvest”和“ xml2”软件包。但是多次出现如下错误 <pre><code>/usr/lib/R/etc/Makecon -
XML节点集到R数据框
我有一个从XML文件中提取的节点集,如下所示: <pre><code> <section id="A00-A09"> <desc> -
如何使用xml2解析描述列表(dl)
我有这样的输入: <pre><code>{xml_nodeset (260)} [1] <dl>\n<dt><span dir="ltr" lang="en">a -
“ rvest”未使用html_nodes()获取产品详细信息
我使用rvest在亚马逊的产品搜索<a href="https://www.amazon.in/s?k=Smartphone&rh=n%3A1389401031&ref=nb_sb_noss" rel="nof -
将xml_node列表转换为xml_document
我有一个xml_node项列表(在下面的reprex中为<code>nodes_list</code>),我想将它们合并成一个带有根节点的xml_