Scrapy XPath语法

如何使用xpath获取嵌套在以下div内的段落文本,但是在Reference之前停下来?谢谢!

在第一段中,我尝试使用SELECTOR ='// div / text()=“ entry-content” / p [1] / text(),但这没有用。

<div class="entry-content"> == 0
   <div id="dpsp-content-top">...</div>
   <span id="xxx">...</span>
   <h5>...</h5>
   <p>...</p>
   <p>...</p>
   <p>...</p>
   <h5>Reference</h5>
   <p>...</p>
   <p>...</p>
</div>
k319770 回答:Scrapy XPath语法

这应该返回“参考”之前的所有“ P”元素

//div[@class='entry-content']//h5/strong[contains(text(),'Reference')]/preceding-sibling::p

如果您需要“ p”元素中的文字,请尝试此操作

//div[@class='entry-content']//h5/strong[contains(text(),'Reference')]/preceding-sibling::p/text()
,

我认为 xpath 应该像

response.xpath('//div[@class='entry-content']/p[1]/text()').extract()

由于<p>在第一个<div>

本文链接:https://www.f2er.com/3107570.html

大家都在问