上面用同样的方法去取首页的 logo 图片地址,第二个可以取到具体值,第一个却不行,求教是为什么
response.xpath('/html/body/header[@id="header"]/div[@id="global-search"]/div[@class="search-inner z-clearfix"]/div[@class="logo-special"]/a/@src').extract()
response.xpath('/html/body/header[@id="header"]/div[@id="global-search"]/div[@class="search-inner z-clearfix"]/h1[@id="logo"]/a/img/@src').extract()
正确的Xpath
response.xpath('/html/body/header[@id="header"]/div[@id="global-search"]/div[@class="search-inner z-clearfix"]/div[@class="logo-special"]/a/img/@src').extract()
1
RyanArthur 2017-11-10 17:51:14 +08:00 1
我没有装 Scrapy,但在提取图片的关键一步是不同的,你要不把第一条语句去掉 @src 调试一下? 看看能取到什么?
|
2
vipper OP @RyanArthur 感谢回复,问题已解决,在第一种方法中定位有问题,少加了 /img 标签,等下用电脑了感谢
|