我正在尝试抓取多个页面,但是我的搜寻器最终在第1页和第2页之间循环。如何编写只能向前移动的脚本?我尝试了以下选择器,但无法从第1页移至第2页。
NEXT_PAGE_SELECTOR = '//span[@class="page-link"]//span[contains(text(),"»")]/preceding-sibling::a/@href'
nextPageUrl = response.urljoin(response.xpath(NEXT_PAGE_SELECTOR).extract_first())
在第1页
<span class="page-link"><a href=".../page/2/"><span aria-hidden="true">»</span><span class="sr-only">Next page</span></a></span>
在第2页
<span class="page-link"><a href=".../page/1/"><span aria-hidden="true">«</span><span class="sr-only">Previous page</span></a></span>
谢谢