html-parsing

如何在Java中使用WebKit从加载的页面获取html

我的目标是使用Java解析Airbnb列表页面，例如： <a href="https://www.airbnb.com/rooms/28149735" rel="nofollow noreferrer">h

前端之家
2022-08-16 • 问答
我试图解析URL列表中的信息，但是我的代码每次都解析同一页面

我正在尝试解析以UTF8格式保存的URL列表以及python空闲文件夹中的命名链接。一个例子是： '<a href="

前端之家
2022-08-16 • 问答
如何查找对特定数据有效的所有HTML标签的列表

我想解析HTML以将其转换为其他格式，同时保留某些样式（粗体，列表等）。为了更好地解释我的

前端之家
2022-08-16 • 问答
Python BeautifulSoup-麻烦解析表并避免不需要的行

我正在尝试从Wikipedia <a href="https://en.wikipedia.org/wiki/Timeline_of_discovery_of_Solar_System_planets_and_their_moons" rel="no

前端之家
2022-08-15 • 问答
如何在Nokogiri中解析图像href

我正在使用Nokogiri解析网页，并想解析出图像URL。这是我的设置： <pre><code>require 'nokogiri' require

前端之家
2022-08-15 • 问答
BeautifulSoup在读取或解析时将内容放置在真实元素之外

我必须解析上一个dd的内容，并将其文本作为其子p文本的列表。请参见下面的屏幕截图： <a href="https://i.

前端之家
2022-08-15 • 问答
在单个页面BS4上采用多个价格

我正在创建，以帮助我学习，但对我也很有用。我希望能够从（<a href="https://www.watchfinder.co.uk/search?q=11406

前端之家
2022-08-15 • 问答
HTML使用重复的div类名称爬取网站

我目前正在HTML上抓取baka-update。但是，Div Class的名称是重复的。由于我的目标是使用csv或json，所

前端之家
2022-08-14 • 问答
AttributeError：“ bytes”对象没有属性“ find_all”

我正在尝试通过网上抓取板球比分webiste获得记分卡。但我收到此属性错误： <strong>跟踪（最近一

前端之家
2022-08-14 • 问答
将所有html元素中的文本替换为HtmlAgilityPack

我正在尝试替换HTML中的字符串。我只对“真实的”文本（textContent）感兴趣。也就是说，不应触摸任何

前端之家
2022-08-14 • 问答
确定字符串是在文本内容内部还是属性的一部分

我正在尝试提出一种算法，该算法可以识别字符串是元素文本内容的一部分还是元素属性的一部分。

前端之家
2022-08-14 • 问答
如何在js中读取嵌入的html字符串？

我有一个字符串，需要将其转换为可读形式。预期的输出附在底部。这基本上是在js中读取<code>html</code>

前端之家
2022-08-13 • 问答
如何从C＃中的HTML FILE检索特定表？

我有一个包含许多表的HTML文件，但是我想从该文件访问特定的表（不是所有表）。那我该怎么办呢？

前端之家
2022-08-13 • 问答
使用Java jsoup解析html页面并存储数据

我正在尝试使用jsoup库来解析html文件，并获取与<code>table class="scl_list"</code>相关的所有数据，如下

前端之家
2022-08-12 • 问答
如何从C＃中的HtmlTable中提取数据并排成一行？

我想逐行从HTMLTable中提取数据。但是我在分隔行中的列时遇到了问题。我在下面使用的代码在一行中为

前端之家
2022-08-11 • 问答
如何从nodejs中的html标签解析获取文本？

我在<strong> nodejs </strong>中有一个html文本，如下所示： <div class =“ snippet” data-lang =“ js” dat

前端之家
2022-08-11 • 问答
在Excel VBA中解析网站问题的几率

我正在尝试学习VBA来解析网站信息。目前，我正在尝试解析某个网站的赔率，但显示一个错误，并且我

前端之家
2022-08-11 • 问答
PHP：从Flutter解析增量数据格式

我正在得到这样的数据 <pre><code> [ {"insert":"Test11"}, {"insert":"","att

前端之家
2022-08-11 • 问答
使用自定义解析器目标时，lxml etree错误

我正在尝试使用自定义解析器目标使用lxml解析页面，该目标将特定元素存储在列表中并返回其余元素。<

前端之家
2022-08-10 • 问答
从<p>而不是<table>的html表中提取数据

我一直在使用pd.read_html尝试从url中提取数据，但是该数据列在标记中，而不是。我可能在这里错过

前端之家
2022-08-10 • 问答
使用BeautifulSoup

HTML页面结构： <pre class="lang-html prettyprint-override"><code><table> <tbody> <tr>

前端之家
2022-08-10 • 问答
在BeautifulSoup中，如何搜索包含文本但又具有特定类祖先的元素？

我正在将BeautifulSoup 4与Python 3.7一起使用。我想找到一个元素，该元素的元素中包含文本“ points”，但还

前端之家
2022-08-10 • 问答
敏捷助手HTML检索p /段落文本，直到到达另一个锚点为止

我正在使用Agility Helper HTML，到目前为止，我已经有了这样的代码： <pre><code> var linkWeb = new HtmlWe

前端之家
2022-08-09 • 问答
捕获所有数据

我有一个与HTML解析有关的问题。我想将<a href="https://voronezh.leroymerlin.ru/catalogue/dekorativnye-oboi/?sortby=8&di

前端之家
2022-08-09 • 问答
具有数据属性的simple_html_dom解析问题

一段时间以来，我一直在努力解决这个问题。我正在尝试解析具有许多div标签的html文档，这些div标签中

前端之家
2022-08-08 • 问答
如何使用Java读取电子邮件中的徽标和图像，其中电子邮件的内容为html /纯文本

我想在电子邮件内容类型为“ text / html”的电子邮件页脚中验证Facebook，Instagram和其他社交网络的徽标。

前端之家
2022-08-07 • 问答
在React

我有一个来自后端的大html字符串，并试图从中提取一些值： <div class =“ snippet” data-lang =“ j

前端之家
2022-08-07 • 问答
角度：未捕获的错误：模板解析错误：无效的ICU消息。失踪 '}' 这不起作用此确实有效为什么Angular认为应该对此进行解析？我该如何强迫Angular的手不解析某些内容？

<h2>未捕获的错误：模板解析错误：无效的ICU消息。缺少“}”。</h2> <h3>这不起作用</em> </h3> <pre class="lang-h

前端之家
2022-08-07 • 问答
使用python解析浏览器发出的请求

<pre><code>CONNECT www.google.com:443 HTTP/1.1\r\nUser-Agent: Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:70.0) Gecko/20100101 Firefox/70.0\r

前端之家
2022-08-06 • 问答
bs4解析与浏览器不同的html

我正在尝试使用Beautifulsoup4抓取farefetch.com（<a href="https://www.farfetch.com/ch/shopping/men/sale/all/items.aspx?page=1&amp

前端之家
2022-08-06 • 问答

首页

下一页
末页