项目加载器具有2个字段A和B。我希望B从A左边的位置捡起。
当前,xpath和输入处理器必须分别传递给它们。
crawler.py
loader.add_xpath('version',"./tr[1]/td[3]/a")
loader.add_xpath('date',"./tr[1]/td[3]/a")
items.py
version=scrapy.Field(
input_processor=MapCompose(get_version,remove_vernacular)
)
date=scrapy.Field(
input_processor=MapCompose(get_version,remove_vernacular,get_date)
)
这里的版本是A,日期是B。我想要类似下面的内容。
date=some_function(version)