Scrapy XPath语法

2024-05-09 • 问答

如何使用xpath获取嵌套在以下div内的段落文本，但是在Reference之前停下来？谢谢！

在第一段中，我尝试使用SELECTOR ='// div / text（）=“ entry-content” / p [1] / text（），但这没有用。

<div class="entry-content"> == 0
   <div id="dpsp-content-top">...</div>
   <span id="xxx">...</span>
   <h5>...</h5>
   <p>...</p>
   <p>...</p>
   <p>...</p>
   <h5>Reference</h5>
   <p>...</p>
   <p>...</p>
</div>

这应该返回“参考”之前的所有“ P”元素

//div[@class='entry-content']//h5/strong[contains(text(),'Reference')]/preceding-sibling::p

如果您需要“ p”元素中的文字，请尝试此操作

//div[@class='entry-content']//h5/strong[contains(text(),'Reference')]/preceding-sibling::p/text()

我认为 xpath 应该像

response.xpath('//div[@class='entry-content']/p[1]/text()').extract()

由于<p>在第一个<div>内

Scrapy XPath语法

k319770 回答：Scrapy XPath语法

大家都在问