使用lxml / scrapy选择器xpath后如何获取原始的html实体?
我已经尝试使用lxml代替parsel包,这是同样的问题。
mytext = '<html><body><span>go od</span></body></html>'
sel = parsel.Selector(text=mytext)
sel.xpath('//body').extract()
实际输出:
['<body><span>go\xa0od</span></body>']
预期输出:
['<body><span>go od</span></body>']
已转换,如何保持原样?