xml2 - 前端之家

我无法从xml提取节点。 xml_find_all无法按预期工作

我的问题可能很简单，但是我在使用xml时遇到问题。我有一个代谢物清单和一个数据库，在这里可以以xm

前端之家
2022-08-15 • 问答
R查找网页API来抓取数据

我正在寻找使用R从网页抓取数据的方法。大多数时候，我会找到网页，然后使用XML2和rvest的组合来抓取

前端之家
2022-08-15 • 问答
带循环的网页抓取

我正在尝试使用循环功能从网站上抓取一些文本，但是在选择向量列表中的下一项时，循环功能并没有

前端之家
2022-08-14 • 问答
强制read_xml将字符串解释为文字XML

我一直在努力迫使<code>read_xml</code>函数（<code>xml2</code>包）将我的字符输入视为文字字符串。显然，如果

前端之家
2022-08-14 • 问答
rvest / xml2的编码问题-xmlXPathTranslateFunction：无效的UTF8字符串

我使用<code>rvest</code>收到了我无法理解的编码错误： <blockquote> xpath_search中的错误（x $ node，x $

前端之家
2022-08-09 • 问答
将数据框转换为XML

我正在尝试将数据框转换为xml。大约有60万条记录。我正在使用XML包： <pre><code>library(XML) con <- xmlO

前端之家
2022-08-09 • 问答
是否有更快的重写来处理丢失的XML属性？

我正在处理巨大的XML文件，例如75 GB或更多，我的意思是，任何小的开销都会变成很多分钟，即使不是几

前端之家
2022-08-08 • 问答
如何下载HTML的源代码

我想下载HTML的源代码。我该怎么办？我尝试使用软件包<code>read_html</code>中的<code>xml2</code>。但是

前端之家
2022-08-07 • 问答
获取节点值和父属性

我有一个如下所示的XML文件： <pre><code>w:tblStyle</code></pre> 我想收集所有<code> <dataDscr> <var ID=

前端之家
2022-08-07 • 问答
从非表格HTML抓取特定数字（作为文本）无效

我正在尝试从HTML网站中提取特定编号。以某种方式，我没有发现我的错误。这是原始代码

前端之家
2022-08-06 • 问答
无法使用RVest抓取页面项目

我正在使用R进行网页抓取，最近正在做一些练习。我目前在当地的eBay列表中玩耍，在那里我可以抓取

前端之家
2022-08-06 • 问答
如何在管道中使用xml_find_first？（没有适用于“ xml_find_first”的适用方法应用于“字符”类的对象）

我试图取消一项用于大学研究的法令，该代码用于旧版本的<code>rvest</code> <pre><code>library("rvest"

前端之家
2022-08-02 • 问答
open.connection（x，“ rb”）中的错误：带有read_html函数的HTTP错误404

使用xml2软件包中的<code>read_html</code>函数时出现以下错误： <pre><code>Error in open.connection(x, "rb") :

前端之家
2022-07-29 • 问答
如何将Markdown文件转换为R DataFrame

我有以下<code>markdown</code>文件（md3.md），我想使用XML转换作为中间步骤将其转换为<code>R dataframe</code>。

前端之家
2022-07-25 • 问答
使用rvest，xml2和选择器小工具进行webscrapping会导致xml_missing <NA>

我正在尝试从以下网址中抓取信息： <a href="https://www.google.com/search?q=812-800%20H%20St%20NW" rel="nofollow n

前端之家
2022-07-23 • 问答
如何将此XML文件转换为“小标题”？

我想更改此XML文件 <a href="https://elections.interieur.gouv.fr/telechargements/MUNICIPALES2020/candidatureT1/001/C1001.xml" rel="n

前端之家
2022-07-18 • 问答
如何从网站获取表格（scrappin）

请让我将此网站中的表格放入Rstudio中： “ <a href="https://www.worldometers.info/coronavirus/#countries" rel="nofollow nor

前端之家
2022-07-17 • 问答
edgarWebR开始给出与xml2软件包有关的错误

此功能在2月中旬生效，但从昨天开始停止。看起来随后可能对xml2进行了一些更新，不确定是否是一个因

前端之家
2022-07-09 • 问答
在tidyverse管道中同时获取xml_attrs和xml_text

我正在尝试使用tidyverse管道将XML转换为小标题。节点同时具有属性和文本。输入： <pre><code>txt

前端之家
2022-07-08 • 问答
如何迭代到网站的最后一页并在.csv文件中逐行写入数据？

我正在尝试抓取一些确实有用的个人信息发布（以下代码），但是我目前必须走到最后一页才能找出其

前端之家
2022-07-07 • 问答
当我尝试致电kableExtra时显示错误

库（kableExtra）出现下一个错误： <blockquote> 错误：get（Info [i，1]，envir = env）中的'kableExtra'包或

前端之家
2022-07-07 • 问答
如何在HTML表格中添加新行

我正在为Uni项目抓取历史狗比赛结果的数据。如何将带有来自其他表的元素的列添加到表？特别是它之

前端之家
2022-07-07 • 问答
`xml2` R软件包未通过XInclude组装多个xml文档

我正在尝试读取一个XML文件，该文件使用XInclude从多个xml文件组装xml。例如如果我有两个名为“ parent.xml

前端之家
2022-07-03 • 问答
使用RVest获取文本时如何保持换行符

我正在从网站上提取法院判决书的文本，并希望保留换行符（稍后需要进行文本分析）。不幸的是，<code

前端之家
2022-07-02 • 问答
从XML子页面中抓取位置不同的项目

到目前为止，我没有从该页面上成功刮除“ Die Verlustursache”表 <pre><code>http://www.ubootarchiv.de/ubootwiki/in

前端之家
2022-06-29 • 问答
错误：软件包“ xml2”的编译失败

我正在Ubuntu 16.04中安装“ rvest”和“ xml2”软件包。但是多次出现如下错误 <pre><code>/usr/lib/R/etc/Makecon

前端之家
2022-06-29 • 问答
XML节点集到R数据框

我有一个从XML文件中提取的节点集，如下所示： <pre><code> <section id="A00-A09"> <desc&gt

前端之家
2022-06-27 • 问答
如何使用xml2解析描述列表（dl）

我有这样的输入： <pre><code>{xml_nodeset (260)} [1] <dl>\n<dt><span dir="ltr" lang="en">a

前端之家
2022-06-26 • 问答
“ rvest”未使用html_nodes（）获取产品详细信息

我使用rvest在亚马逊的产品搜索<a href="https://www.amazon.in/s?k=Smartphone&rh=n%3A1389401031&ref=nb_sb_noss" rel="nof

前端之家
2022-06-26 • 问答
将xml_node列表转换为xml_document

我有一个xml_node项列表（在下面的reprex中为<code>nodes_list</code>），我想将它们合并成一个带有根节点的xml_

前端之家
2022-06-21 • 问答

首页

下一页
末页