使用Google表格进行网页抓取。需要正确的IMPORTXML函数的xpath

有一个Google工作表,其中包含MPN的列表(制造商零件编号)。当我拥有某项的MPN时,尝试为UPC代码抓取一个名为wikiarms的站点。

我有在其他网站上执行此操作的正确公式。

=IMPORTXML("http://gun.deals/search/apachesolr_search/"&B1,"//dd/a[../../dt[contains(text(),'UPC')]]|//dd/span[../../dt[contains(text(),'UPC')]]")

试图找出正确的xpath来完成此公式。我看过的一些视频说可以在Chrome中打开页面,并使用检查器选择并复制xpath以完成importxml功能。我没有运气尝试过。

样本 访问https://www.wikiarms.com/guns?q=20071

在表格中有一个按钮“在6个商店中可用”,单击该按钮可显示该列表。 UPC应该在MPN之后列出。

如果我在Chrome中复制xpath,这就是结果

/html/body/div[1]/div/div/div[2]/div/div/div[2]/div[2]/table/tbody/tr[2]/td[5]

=IMPORTXML("https://www.wikiarms.com/guns?q="&B2,"xpath here")

要在此公式的末尾添加UPC代码,我必须添加什么?我将使用此公式来提取大约1000个项目的UPC代码。

谢谢您的帮助。

liping0207 回答:使用Google表格进行网页抓取。需要正确的IMPORTXML函数的xpath

使用示例链接,尝试

=IMPORTXML("https://www.wikiarms.com/guns?q=20071","//td[@class='upc']/a/@title")

看看它是否对您有用。

本文链接:https://www.f2er.com/3156460.html

大家都在问